Inhalt
- Die Art der erforderlichen Daten
- Der Goodness-of-Fit-Test
- Berechnung der Chi-Quadrat-Statistik
- Interpretation der Chi-Quadrat-Statistik
Experimente testen Vorhersagen. Diese Vorhersagen sind häufig numerisch, was bedeutet, dass Wissenschaftler beim Sammeln von Daten erwarten, dass sich die Zahlen auf eine bestimmte Weise auflösen. Daten aus der realen Welt stimmen selten genau mit den Vorhersagen überein, die Wissenschaftler treffen. Daher müssen die Wissenschaftler anhand eines Tests feststellen, ob der Unterschied zwischen beobachteten und erwarteten Zahlen zufällig ist oder aufgrund eines unvorhergesehenen Faktors, der den Wissenschaftler zwingt, die zugrunde liegende Theorie anzupassen . Ein Chi-Quadrat-Test ist ein statistisches Werkzeug, das Wissenschaftler zu diesem Zweck verwenden.
Die Art der erforderlichen Daten
Sie benötigen kategoriale Daten, um einen Chi-Quadrat-Test durchzuführen. Ein Beispiel für kategoriale Daten ist die Anzahl der Personen, die eine Frage mit "Ja" beantwortet haben, gegenüber der Anzahl der Personen, die die Frage mit "Nein" beantwortet haben (zwei Kategorien), oder die Anzahl der Frösche in einer Population, die grün, gelb oder grau sind ( drei Kategorien). Sie können einen Chi-Quadrat-Test nicht für fortlaufende Daten verwenden, die möglicherweise aus einer Umfrage stammen, in der die Personen gefragt werden, wie groß sie sind. Bei einer solchen Umfrage würden Sie ein breites Spektrum an Höhen erhalten. Wenn Sie die Höhen jedoch in Kategorien wie "unter 6 Fuß hoch" und "über 6 Fuß hoch" einteilen, können Sie die Daten mit einem Chi-Quadrat-Test testen.
Der Goodness-of-Fit-Test
Ein Anpassungstest ist ein allgemeiner und möglicherweise der einfachste Test, der unter Verwendung der Chi-Quadrat-Statistik durchgeführt wird. In einem Anpassungstest trifft die Wissenschaftlerin eine spezifische Vorhersage über die Zahlen, die sie in jeder Kategorie ihrer Daten erwartet. Sie sammelt dann reale Daten, die als beobachtete Daten bezeichnet werden, und verwendet den Chi-Quadrat-Test, um festzustellen, ob die beobachteten Daten ihren Erwartungen entsprechen.
Stellen Sie sich zum Beispiel vor, ein Biologe untersucht die Vererbungsmuster einer Froschart. Unter 100 Nachkommen einer Gruppe von Froscheltern erwartet sie nach dem genetischen Modell der Biologen 25 gelbe Nachkommen, 50 grüne Nachkommen und 25 graue Nachkommen. Was sie tatsächlich beobachtet, sind 20 gelbe, 52 grüne und 28 graue Nachkommen. Wird ihre Vorhersage unterstützt oder ist ihr genetisches Modell falsch? Sie kann einen Chi-Quadrat-Test verwenden, um dies herauszufinden.
Berechnung der Chi-Quadrat-Statistik
Beginnen Sie mit der Berechnung der Chi-Quadrat-Statistik, indem Sie jeden erwarteten Wert von seinem entsprechenden beobachteten Wert abziehen und jedes Ergebnis quadrieren. Die Berechnung für das Beispiel des Froschnachwuchses würde so aussehen:
gelb = (20 - 25) ^ 2 = 25 grün = (52 - 50) ^ 2 = 4 grau = (28 - 25) ^ 2 = 9
Teilen Sie nun jedes Ergebnis durch seinen entsprechenden Erwartungswert.
Gelb = 25 × 25 = 1 Grün = 4 × 50 = 0,08 Grau = 9 × 25 = 0,36
Addieren Sie abschließend die Antworten aus dem vorherigen Schritt.
Chi-Quadrat = 1 + 0,08 + 0,36 = 1,44
Interpretation der Chi-Quadrat-Statistik
Die Chi-Quadrat-Statistik zeigt Ihnen, wie unterschiedlich Ihre beobachteten Werte von Ihren vorhergesagten Werten waren. Je höher die Zahl, desto größer der Unterschied. Sie können feststellen, ob Ihr Chi-Quadrat-Wert zu hoch oder zu niedrig ist, um Ihre Vorhersage zu stützen, indem Sie feststellen, ob er unter einem bestimmten Wert liegt kritischer Wert auf einer Chi-Quadrat-Verteilungstabelle. Diese Tabelle vergleicht Chi-Quadrat-Werte mit den genannten Wahrscheinlichkeiten p-Werte. Die Tabelle zeigt Ihnen insbesondere die Wahrscheinlichkeit, dass die Unterschiede zwischen Ihren beobachteten und erwarteten Werten einfach auf zufällige Zufälle zurückzuführen sind oder ob ein anderer Faktor vorliegt. Für einen Anpassungstest müssen Sie Ihre Vorhersage ablehnen, wenn der p-Wert 0,05 oder weniger beträgt.
Sie müssen das bestimmen Freiheitsgrade (df) in Ihren Daten, bevor Sie den kritischen Chi-Quadrat-Wert in einer Verteilungstabelle nachschlagen können. Freiheitsgrade werden berechnet, indem 1 von der Anzahl der Kategorien in Ihren Daten abgezogen wird. In diesem Beispiel gibt es drei Kategorien, daher gibt es zwei Freiheitsgrade. Ein Blick auf diese Chi-Quadrat-Verteilungstabelle zeigt, dass für 2 Freiheitsgrade der kritische Wert für eine Wahrscheinlichkeit von 0,05 5,99 beträgt. Dies bedeutet, dass solange Ihr berechneter Chi-Quadrat-Wert unter 5,99 liegt, Ihre erwarteten Werte und damit die zugrunde liegende Theorie gültig sind und unterstützt werden. Da die Chi-Quadrat-Statistik für die Daten der Froschnachkommen 1,44 betrug, kann die Biologin ihr genetisches Modell akzeptieren.