Inhalt
Vereinfachen Sie den Vergleich von Zahlenmengen, insbesondere von großen Zahlenmengen, indem Sie die Mittelwerte anhand von Mittelwert, Modus und Median berechnen. Verwenden Sie die Bereiche und Standardabweichungen der Mengen, um die Variabilität der Daten zu untersuchen.
Mittelwert berechnen
Der Mittelwert gibt den Durchschnittswert der Zahlenmenge an. Betrachten Sie beispielsweise den Datensatz mit den Werten 20, 24, 25, 36, 25, 22, 23.
Verwenden Sie die folgende Formel, um den Mittelwert zu ermitteln: Mittelwert ist die Summe der Zahlen im Datensatz geteilt durch die Anzahl der Werte im Datensatz. In mathematischen Begriffen: Mittelwert = (Summe aller Begriffe) ÷ (wie viele Begriffe oder Werte in der Menge).
Fügen Sie die Zahlen im Beispieldatensatz hinzu: 20 + 24 + 25 + 36 + 25 + 22 + 23 = 175.
Teilen Sie durch die Anzahl der Datenpunkte im Satz. Dieser Satz hat sieben Werte, also teilen Sie durch 7.
Fügen Sie die Werte in die Formel ein, um den Mittelwert zu berechnen. Der Mittelwert entspricht der Summe der Werte (175) geteilt durch die Anzahl der Datenpunkte (7). Da 175 ÷ 7 = 25 ist, ist der Mittelwert dieses Datensatzes gleich 25. Nicht alle Mittelwerte sind gleich einer ganzen Zahl.
Berechnen des Medians
Der Median gibt den Mittelpunkt oder den Mittelwert einer Reihe von Zahlen an.
Ordnen Sie die Zahlen in der Reihenfolge vom kleinsten zum größten. Verwenden Sie den beispielhaften Wertesatz: 20, 24, 25, 36, 25, 22, 23. Ordnet sich der Satz wie folgt an: 20, 22, 23, 24, 25, 25, 36.
Da dieser Satz von Zahlen sieben Werte hat, ist der Median oder Wert in der Mitte 24.
Wenn der Satz von Zahlen eine gerade Anzahl von Werten hat, berechnen Sie den Durchschnitt der beiden Mittelwerte. Angenommen, die Zahlengruppe enthält die Werte 22, 23, 25, 26. Die Mitte liegt zwischen 23 und 25. Wenn Sie 23 und 25 addieren, erhalten Sie 48. Wenn Sie 48 durch zwei dividieren, erhalten Sie einen Medianwert von 24.
Rechenmodus
Der Modus identifiziert den oder die häufigsten Werte im Datensatz. Abhängig von den Daten kann es einen oder mehrere Modi oder gar keinen Modus geben.
Ordnen Sie den Datensatz wie das Ermitteln des Medians vom kleinsten zum größten. Im Beispielsatz lauten die geordneten Werte: 20, 22, 23, 24, 25, 25, 36.
Ein Modus tritt auf, wenn sich die Werte wiederholen. Im Beispielsatz kommt der Wert 25 zweimal vor. Keine anderen Nummern wiederholen. Daher ist der Modus der Wert 25.
In einigen Datensätzen tritt mehr als ein Modus auf. Der Datensatz 22, 23, 23, 24, 27, 27, 29 enthält zwei Modi, jeweils einen bei 23 und 27. Andere Datensätze können mehr als zwei Modi haben, können Modi mit mehr als zwei Zahlen haben (wie 23, 23 , 24, 24, 24, 28, 29: Modus ist gleich 24) oder hat möglicherweise überhaupt keine Modi (wie 21, 23, 24, 25, 26, 27, 29). Der Modus kann an einer beliebigen Stelle im Datensatz auftreten, nicht nur in der Mitte.
Rechenbereich
Bereich zeigt den mathematischen Abstand zwischen dem niedrigsten und dem höchsten Wert im Datensatz. Range misst die Variabilität des Datensatzes. Ein weiter Bereich weist auf eine größere Variabilität der Daten hin, oder möglicherweise auf einen einzelnen Ausreißer, der weit vom Rest der Daten entfernt ist. Ausreißer können den Mittelwert so weit verschieben oder verschieben, dass sich dies auf die Datenanalyse auswirkt.
In der Stichprobengruppe beträgt der niedrigste Wert 20 und der höchste Wert 36.
Um den Bereich zu berechnen, subtrahieren Sie den niedrigsten vom höchsten Wert. Da 36-20 = 16 ist, entspricht der Bereich 16.
Im Beispielsatz übersteigt der hohe Datenwert von 36 den vorherigen Wert von 25 um 11. Dieser Wert scheint angesichts der anderen Werte im Satz extrem zu sein. Der Wert 36 kann ein Ausreißerdatenpunkt sein.
Berechnung der Standardabweichung
Die Standardabweichung misst die Variabilität des Datensatzes. Eine kleinere Standardabweichung zeigt wie der Bereich eine geringere Variabilität an.
Um die Standardabweichung zu ermitteln, müssen Sie die quadrierte Differenz zwischen jedem Datenpunkt und dem Mittelwert summieren, alle Quadrate addieren, diese Summe durch eine Zahl weniger als die Anzahl der Werte (N-1) dividieren und schließlich die Quadratwurzel der Dividende berechnen. Beginnen Sie mathematisch mit der Mittelwertbildung.
Berechnen Sie den Mittelwert, indem Sie alle Datenpunktwerte addieren und durch die Anzahl der Datenpunkte dividieren. Im Beispieldatensatz ist 20 + 24 + 25 + 36 + 25 + 22 + 23 = 175. Teilen Sie die Summe 175 durch die Anzahl der Datenpunkte 7 oder 175 ÷ 7 = 25. Der Mittelwert ist 25.
Subtrahieren Sie als Nächstes den Mittelwert von jedem Datenpunkt und quadrieren Sie dann jede Differenz. Die Formel sieht so aus: ∑ (x-µ)2wobei ∑ die Summe bedeutet, x jeden Datensatzwert darstellt und µ den Mittelwert darstellt. Wenn Sie mit dem eingestellten Beispiel fortfahren, werden die Werte: 20-25 = -5 und -52= 25; 24-25 = -1 und -12= 1; 25-25 = 0 und 02= 0; 36-25 = 11 und 112= 121; 25-25 = 0 und 02= 0; 22-25 = -3 und -32= 9; und 23-25 = -2 und -22=4.
Addiert man die quadrierten Differenzen, ergibt sich: 25 + 1 + 0 + 121 + 0 + 9 + 4 = 160.
Teilen Sie die Summe der quadrierten Differenzen durch eins weniger als die Anzahl der Datenpunkte. Der Beispieldatensatz hat 7 Werte, also ist N-1 gleich 7-1 = 6. Die Summe der quadrierten Differenzen 160 geteilt durch 6 ergibt ungefähr 26,6667.
Berechnen Sie die Standardabweichung, indem Sie die Quadratwurzel der Division durch N-1 ermitteln. Im Beispiel entspricht die Quadratwurzel von 26,6667 ungefähr 5,164. Daher beträgt die Standardabweichung ungefähr 5,164.
Standardabweichung hilft bei der Auswertung von Daten. Zahlen im Datensatz, die innerhalb einer Standardabweichung des Mittelwerts liegen, sind Teil des Datensatzes. Zahlen, die außerhalb von zwei Standardabweichungen liegen, sind Extremwerte oder Ausreißer. Im Beispielsatz liegt der Wert 36 mehr als zwei Standardabweichungen vom Mittelwert, sodass 36 ein Ausreißer ist. Ausreißer können fehlerhafte Daten darstellen oder auf unvorhergesehene Umstände hinweisen und sollten bei der Interpretation von Daten sorgfältig berücksichtigt werden.