Inhalt
Das Ermitteln der Stärke der Assoziation zwischen zwei Variablen ist eine wichtige Fähigkeit für Wissenschaftler aller Art. Wenn zwei Variablen miteinander korreliert sind, zeigt dies, dass eine Verbindung zwischen ihnen besteht. Eine positive Korrelation bedeutet, dass wenn eine Variable zunimmt, die andere ebenfalls zunimmt, und eine negative Korrelation bedeutet, dass wenn eine Variable zunimmt, die andere abnimmt. Korrelationen belegen keine Verursachung, obwohl es möglich ist, dass weitere Tests einen Kausalzusammenhang zwischen den Variablen belegen. Der Korrelationskoeffizient R zeigt die Stärke der Beziehung zwischen den beiden Variablen und ob es sich um eine positive oder negative Korrelation handelt.
TL; DR (zu lang; nicht gelesen)
Rufen Sie eine Variable auf X und eine Variable y. Berechnen Sie den Wert von R mit der Formel:
R = ÷ √ {}
Wo n ist Ihre Stichprobengröße.
Machen Sie eine Tabelle Ihrer Daten. Dies sollte eine Spalte für die Teilnehmernummer und eine Spalte für die erste Variable (beschriftet) enthalten X) und eine Spalte für die zweite Variable (beschriftet y). Wenn Sie beispielsweise prüfen möchten, ob ein Zusammenhang zwischen Größe und Schuhgröße besteht, wird in einer Spalte jede von Ihnen gemessene Person identifiziert, in einer Spalte wird die Größe jeder Person und in einer anderen Spalte die Schuhgröße angezeigt. Machen Sie drei zusätzliche Spalten, eine für xy, eins für X2 und eine für y2.
Verwenden Sie Ihre Daten, um die drei zusätzlichen Spalten auszufüllen. Stellen Sie sich zum Beispiel vor, Ihre erste Person ist 75 Zoll groß und 12 Fuß groß. Das X (Höhe) Spalte würde 75 zeigen, und die y Spalte (Schuhgröße) würde 12 anzeigen. Sie müssen finden xy, X2 und y2. Also mit diesem Beispiel:
xy = 75 × 12 = 900
X2 = 752 = 5,625
y2 = 122 = 144
Vervollständigen Sie diese Berechnungen für jede Person, für die Sie Daten haben.
Erstellen Sie eine neue Zeile am unteren Rand Ihrer Tabelle für die Summen jeder Spalte. Addieren Sie alle X Werte, alle y Werte, alle xy Werte, alle X2 Werte und alle y2 Werte, und setzen Sie die Ergebnisse am unteren Rand der entsprechenden Spalte in der neuen Zeile. Sie können Ihre neue Zeile als "Summe" kennzeichnen oder ein Sigma (Σ) -Symbol verwenden.
Sie finden R aus Ihren Daten mit der Formel:
R = ÷ √ {}
Das sieht ein bisschen abschreckend aus, sodass Sie es in zwei Teile aufteilen können, die wir als s und t.
s = n (Σxy) - (Σx) (Σy)
t = √ {}
In diesen Gleichungen n ist die Anzahl der Teilnehmer, die Sie haben (Ihre Stichprobengröße). Die restlichen Teile der Gleichung sind die Summen, die Sie im letzten Schritt berechnet haben. So für s, multiplizieren Sie die Größe Ihrer Stichprobe mit der Summe der xy Spalte, und subtrahieren Sie dann die Summe der X Spalte multipliziert mit der Summe der y Spalte von diesem.
Zum tEs gibt vier Hauptschritte. Berechnen Sie zuerst n multipliziert mit der Summe Ihrer X2 Spalte, und subtrahieren Sie dann die Summe Ihrer X Quadratische Spalte (multipliziert mit sich selbst) aus diesem Wert. Zweitens machen Sie genau das Gleiche, aber mit der Summe der y2 Spalte und die Summe der y Spalte im Quadrat anstelle der X Teile (d. h. n × Σy2 -). Drittens multiplizieren Sie diese beiden Ergebnisse (für die Xs und ys) zusammen. Viertens, nimm die Quadratwurzel dieser Antwort.
Wenn Sie in Teilen gearbeitet haben, können Sie rechnen R so einfach R = s ÷ t. Sie erhalten eine Antwort zwischen -1 und 1. Eine positive Antwort zeigt eine positive Korrelation, wobei alles über 0,7 im Allgemeinen als starke Beziehung angesehen wird. Eine negative Antwort zeigt eine negative Korrelation, wobei alles über -0,7 als starke negative Beziehung angesehen wird. In ähnlicher Weise wird ± 0,5 als mäßige Beziehung und ± 0,3 als schwache Beziehung angesehen. Alles, was nahe bei 0 liegt, zeigt einen Mangel an Korrelation.