Inhalt
- Erstellen eines Streudiagramms
- Linie der besten Passform
- Gleichung der geraden Linie
- Lineare Regression
Ein Streudiagramm ist ein Diagramm, das die Beziehung zwischen zwei Datensätzen zeigt. Manchmal ist es hilfreich, die in einem Streudiagramm enthaltenen Daten zu verwenden, um eine mathematische Beziehung zwischen zwei Variablen zu erhalten. Die Gleichung eines Streudiagramms kann von Hand auf zwei Arten erhalten werden: eine grafische Technik oder eine als lineare Regression bezeichnete Technik.
Erstellen eines Streudiagramms
Verwenden Sie Millimeterpapier, um ein Streudiagramm zu erstellen. Zeichnen Sie die x- und y-Achse, achten Sie darauf, dass sie den Ursprung schneiden und beschriften. Stellen Sie sicher, dass die x- und y-Achse auch die richtigen Titel haben. Zeichnen Sie anschließend jeden Datenpunkt im Diagramm. Alle Trends zwischen den aufgezeichneten Datensätzen sollten jetzt erkennbar sein.
Linie der besten Passform
Sobald ein Streudiagramm erstellt wurde, können wir unter der Annahme, dass eine lineare Korrelation zwischen zwei Datensätzen besteht, eine grafische Methode verwenden, um die Gleichung zu erhalten. Nehmen Sie ein Lineal und ziehen Sie eine Linie so nah wie möglich an alle Punkte. Stellen Sie sicher, dass sich über der Linie so viele Punkte befinden wie unter der Linie. Nachdem die Linie gezeichnet wurde, verwenden Sie Standardmethoden, um die Gleichung der geraden Linie zu finden
Gleichung der geraden Linie
Sobald eine Linie der besten Anpassung auf einem Streudiagramm platziert wurde, ist es einfach, die Gleichung zu finden. Die allgemeine Gleichung einer geraden Linie lautet:
y = mx + c
Dabei ist m die Steigung der Linie und c der y-Achsenabschnitt. Um den Farbverlauf zu erhalten, suchen Sie zwei Punkte auf der Linie. Nehmen wir für dieses Beispiel an, dass die beiden Punkte (1,3) und (0,1) sind. Der Gradient kann berechnet werden, indem die Differenz der y-Koordinaten und die Differenz der x-Koordinaten dividiert werden:
m = (3 - 1) / (1 - 0) = 2/1 = 2
Die Steigung ist in diesem Fall gleich 2. Bisher ist die Gleichung der geraden Linie
y = 2x + c
Der Wert für c kann durch Einsetzen der Werte für einen bekannten Punkt erhalten werden. Nach dem Beispiel ist einer der bekannten Punkte (1,3). Stecken Sie dies in die Gleichung und ordnen Sie für c neu:
3 = (2 · 1) + c
c = 3 - 2 = 1
Die endgültige Gleichung lautet in diesem Fall:
y = 2x + 1
Lineare Regression
Die lineare Regression ist eine mathematische Methode, mit der die Geradengleichung eines Streudiagramms erhalten werden kann. Beginnen Sie, indem Sie Ihre Daten in eine Tabelle einfügen. Für dieses Beispiel nehmen wir an, dass wir die folgenden Daten haben:
(4.1, 2.2) (6.5, 4.5) (12.6, 10.4)
Berechnen Sie die Summe der x-Werte:
x_sum = 4,1 + 6,5 + 12,6 = 23,2
Berechnen Sie als nächstes die Summe der y-Werte:
y_sum = 2,2 + 4,4 + 10,4 = 17
Summieren Sie nun die Produkte jedes Datenpunktsatzes:
xy_sum = (4,1 × 2,2) + (6,5 × 4,4) + (12,6 × 10,4) = 168,66
Berechnen Sie als Nächstes die Summe der quadrierten x-Werte und der quadrierten y-Werte:
x_square_sum = (4,1 ^ 2) + (6,5 ^ 2) + (12,6 ^ 2) = 217,82
y_square_sum = (2,2 ^ 2) + (4,5 ^ 2) + (10,4 ^ 2) = 133,25
Schließlich zählen Sie die Anzahl der Datenpunkte, die Sie haben. In diesem Fall haben wir drei Datenpunkte (N = 3). Der Gradient für die Best-Fit-Linie kann wie folgt ermittelt werden:
m = (N * xy_sum) - (x_sum * y_sum) / (N * x_square_sum) - (x_sum * x_sum) = (3 * 168,66) - (23,2 * 17) / (3 * 217,82) - (23,2 * 23,2) = 0,968
Der Achsenabschnitt für die am besten passende Linie kann erhalten werden von:
c = (x_square_sum * y_sum) - (x_sum * xy_sum) / (N * x_square_sum) - (x_sum * x_sum)
= (217.82 17) - (23.2 168.66) / (3 * 217.82) - (23.2 * 23.2) = -1.82
Die endgültige Gleichung lautet daher:
y = 0,968x - 1,82