So berechnen Sie das Bestimmtheitsmaß

Korrelation ist nicht unbedingt gleich Kausalität, aber das Finden einer Korrelation zwischen zwei Variablen in einem Experiment ist immer noch ein sehr wichtiger Hinweis auf die Beziehung zwischen ihnen. Aus diesem Grund sind Korrelationstests eine der gebräuchlichsten Arten von statistischen Tests, die in der Wissenschaft verwendet werden, wobei der Korrelationskoeffizient von Pearson am bekanntesten ist.

Das Bestimmtheitsmaß ist jedoch wohl wichtiger, da es den Anteil der Variation einer Variablen angibt, der basierend auf der anderen vorhergesagt werden kann. Deshalb ist es für jeden wichtig, der mit korrelationsbasierten Statistiken arbeitet, die Berechnung des Bestimmtheitsmaßes zu erlernen.

Was ist der Bestimmungskoeffizient?

Eine grundlegende Definition des Bestimmtheitsmaßes ist, dass es das Quadrat des Korrelationskoeffizienten von Pearson ist, r, und wird daher oft als R. bezeichnet2.

Pearson-Koeffizient misst Korrelationen, bei denen eine Zunahme einer Variablen entweder mit einer Zunahme einer anderen (eine positive Korrelation) oder einer Abnahme derselben (eine negative Korrelation) einhergeht. Der Wert für

instagram story viewer
r kann alles zwischen -1 und +1 sein, wobei die Größe der Zahl Ihnen die Stärke der Korrelation und das Vorzeichen sagt, ob es sich um eine positive oder eine negative Korrelation handelt.

R2 ist das Quadrat dieser Kennzahl, variiert also zwischen 0 und 1 und gibt an, wie viel Prozent der Variation in einer Variablen durch die korrelierte Variable vorhergesagt werden kann. Dies ist für viele Dinge nützlich, insbesondere zum Erstellen mathematischer Modelle für Vorhersagezwecke.

Bestimmungskoeffizientenberechnung

Die Berechnung des Bestimmtheitsmaßes ist daher grundsätzlich die gleiche wie die Berechnung des Korrelationskoeffizienten nach Pearson, außer dass Sie am Ende das Ergebnis quadrieren. Die Formel für den Korrelationskoeffizienten nach Pearson lautet:

r=\frac{n\sum xy -\sum x\sum y }{\sqrt{(n\sum x^2 -(\sum x)^2)-(n\sum y^2 -(\sum y )^2)}}

Es gibt einige wichtige Informationen, die Sie benötigen, um diese (zugegebenermaßen beängstigend aussehende!) Formel durchzuarbeiten: Ihre x und ja Werte für jede Beobachtung (d. h. Ihre beiden Variablen), die Summe Ihrer x und ja Werte, die Summe von jedem x Variable multipliziert mit dem entsprechenden ja variabel, und die Summen von jedem x und ja variabel quadriert.

Eine bequeme Möglichkeit, dies herauszufinden, ist die Verwendung von a Kalkulationstabelle Programm wie Microsoft Excel, mit Spalten für x, ja, xy, x2 und ja2 und Summen unten für jede Spalte. Sie benötigen außerdem einen Wert für nein, die Größe Ihrer Stichprobe (jedes mit einem x und ein ja Wert).

Führen Sie den von der Formel angegebenen Prozess durch. Erste Klappe nein multipliziert mit der Summe deiner xy Werte und subtrahiere dann die Summe von x Werte multipliziert mit der Summe von ja Werte.

Teilen Sie dieses gesamte Ergebnis durch den unteren Abschnitt: nein mal die Summe der Quadrate deiner x Werte abzüglich der Summe von x Werte quadriert, alle multipliziert mit dem Ergebnis derselben Sache für Ihre ja Werte und ziehen schließlich die Quadratwurzel, bevor die Division durchgeführt wird. Das gibt dir r, die Sie einfach quadrieren, um R. zu erhalten2.

Interpretieren des Bestimmtheitsmaßes

Das Bestimmtheitsmaß ist eine Zahl zwischen 0 und 1, die durch Multiplikation mit 100 in einen Prozentsatz umgerechnet werden kann. Die Standardinterpretation des Bestimmtheitsmaßes ist der Betrag der Variation in y, der erklärt werden kann durch x, mit anderen Worten, wie gut die Daten zu dem von Ihnen verwendeten Regressionsmodell passen, beschreiben Sie sie.

Es ist jedoch wichtig, die üblichen Vorbehalte in Daten zu beachten, die auf Korrelationen basieren. Es ist durchaus möglich, dass zwei Variablen korreliert sind, ohne kausal zusammenzuhängen.

Nehmen Sie zum Beispiel den Zusammenhang zwischen der Verwendung von Hörgeräten und der Anzahl der Falten auf Ihrer Haut. Es gibt eine starke Korrelation zwischen den beiden, aber natürlich sind beide wirklich altersbedingt. Dies ist kein Fehler des Ansatzes, sondern eine Einschränkung, die Sie berücksichtigen müssen, um die Ergebnisse richtig zu interpretieren.

Teachs.ru
  • Teilen
instagram viewer