Experimente testen Vorhersagen. Diese Vorhersagen sind oft numerisch, was bedeutet, dass Wissenschaftler beim Sammeln von Daten erwarten, dass die Zahlen auf eine bestimmte Weise zusammenbrechen. Daten aus der realen Welt stimmen selten genau mit den Vorhersagen überein, die Wissenschaftler machen, daher benötigen Wissenschaftler einen Test, um festzustellen, ob der Unterschied zwischen den beobachteten und erwartete Zahlen sind auf zufällige Zufälle zurückzuführen oder auf einen unvorhergesehenen Faktor, der den Wissenschaftler dazu zwingt, die zugrunde liegende Theorie anzupassen. Ein Chi-Quadrat-Test ist ein statistisches Werkzeug, das Wissenschaftler zu diesem Zweck verwenden.
Die Art der erforderlichen Daten
Sie benötigen kategoriale Daten, um einen Chi-Quadrat-Test zu verwenden. Ein Beispiel für kategoriale Daten ist die Anzahl der Personen, die eine Frage mit "Ja" beantwortet haben, im Vergleich zur Anzahl der Personen, die geantwortet haben die Frage "Nein" (zwei Kategorien) oder die Anzahl der Frösche in einer Population, die grün, gelb oder grau sind (drei Kategorien). Sie können keinen Chi-Quadrat-Test für kontinuierliche Daten verwenden, die beispielsweise bei einer Umfrage erhoben werden, in der Personen nach ihrer Größe gefragt werden. Aus einer solchen Umfrage würden Sie eine breite Palette von Höhen erhalten. Wenn Sie die Höhen jedoch in Kategorien wie "unter 1,80 m groß" und "1,80 m groß und darüber" einteilen, können Sie die Daten mit einem Chi-Quadrat-Test testen.
Der Passungstest
Ein Anpassungstest ist ein üblicher und vielleicht der einfachste Test, der unter Verwendung der Chi-Quadrat-Statistik durchgeführt wird. In einem Anpassungstest macht die Wissenschaftlerin eine spezifische Vorhersage über die Zahlen, die sie in jeder Kategorie ihrer Daten erwartet. Anschließend sammelt sie reale Daten – sogenannte beobachtete Daten – und verwendet den Chi-Quadrat-Test, um zu sehen, ob die beobachteten Daten ihren Erwartungen entsprechen.
Stellen Sie sich zum Beispiel vor, ein Biologe untersucht die Vererbungsmuster einer Froschart. Unter 100 Nachkommen eines Satzes von Froscheltern erwartet die Biologin nach ihrem genetischen Modell 25 gelbe Nachkommen, 50 grüne Nachkommen und 25 graue Nachkommen. Was sie tatsächlich beobachtet, sind 20 gelbe Nachkommen, 52 grüne Nachkommen und 28 graue Nachkommen. Wird ihre Vorhersage unterstützt oder ist ihr genetisches Modell falsch? Sie kann einen Chi-Quadrat-Test verwenden, um das herauszufinden.
Berechnung der Chi-Quadrat-Statistik
Beginnen Sie mit der Berechnung der Chi-Quadrat-Statistik, indem Sie jeden erwarteten Wert von seinem entsprechenden beobachteten Wert subtrahieren und jedes Ergebnis quadrieren. Die Berechnung für das Beispiel des Froschnachwuchses würde so aussehen:
gelb = (20 - 25)^2 = 25 grün = (52 - 50)^2 = 4 grau = (28 - 25)^2 = 9
Teilen Sie nun jedes Ergebnis durch den entsprechenden Erwartungswert.
gelb = 25 25 = 1 grün = 4 ÷ 50 = 0,08 grau = 9 ÷ 25 = 0,36
Zum Schluss addieren Sie die Antworten aus dem vorherigen Schritt.
Chi-Quadrat = 1 + 0,08 + 0,36 = 1,44
Interpretieren der Chi-Quadrat-Statistik
Die Chi-Quadrat-Statistik sagt Ihnen, wie unterschiedlich Ihre beobachteten Werte von Ihren vorhergesagten Werten waren. Je höher die Zahl, desto größer die Differenz. Sie können feststellen, ob Ihr Chi-Quadrat-Wert zu hoch oder niedrig genug ist, um Ihre Vorhersage zu unterstützen, indem Sie sehen, ob er unter einem bestimmten Wert liegt kritischer Wert auf einer Chi-Quadrat-Verteilungstabelle. Diese Tabelle gleicht Chi-Quadrat-Werte mit Wahrscheinlichkeiten ab, genannt p-Werte. Die Tabelle gibt Ihnen insbesondere die Wahrscheinlichkeit an, dass die Unterschiede zwischen Ihren beobachteten und erwarteten Werten einfach auf Zufall zurückzuführen sind oder ob ein anderer Faktor vorliegt. Bei einem Anpassungstest müssen Sie Ihre Vorhersage ablehnen, wenn der p-Wert 0,05 oder weniger beträgt.
Sie müssen bestimmen, Freiheitsgrade (df) in Ihren Daten, bevor Sie den kritischen Chi-Quadrat-Wert in einer Verteilungstabelle nachschlagen können. Freiheitsgrade werden berechnet, indem 1 von der Anzahl der Kategorien in Ihren Daten abgezogen wird. In diesem Beispiel gibt es drei Kategorien, also 2 Freiheitsgrade. Ein Blick auf diese Chi-Quadrat-Verteilungstabelle sagt Ihnen, dass für 2 Freiheitsgrade der kritische Wert für eine Wahrscheinlichkeit von 0,05 5,99 beträgt. Das bedeutet, solange Ihr berechneter Chi-Quadrat-Wert kleiner als 5,99 ist, sind Ihre erwarteten Werte und damit die zugrunde liegende Theorie gültig und unterstützt. Da die Chi-Quadrat-Statistik für die Froschnachkommendaten 1,44 beträgt, kann die Biologin ihr genetisches Modell akzeptieren.