Inhalt
- TL; DR (zu lang; nicht gelesen)
- Datenpunkte bestellen
- Bestimmen Sie die Position des ersten Quartils
- Bestimmen Sie die Position des dritten Quartils
- Interquartilbereich berechnen
- Vor- und Nachteile von IQR
Der Interquartilbereich, der oft als IQR abgekürzt wird, gibt den Bereich zwischen dem 25. Perzentil und dem 75. Perzentil oder den mittleren 50 Prozent eines bestimmten Datensatzes an. Der Interquartilbereich kann verwendet werden, um den durchschnittlichen Leistungsbereich eines Tests zu bestimmen: Sie können ihn verwenden, um zu sehen, wo die meisten Personen bei einem bestimmten Test fallen, oder um zu bestimmen, wie viel Geld ein durchschnittlicher Mitarbeiter in einem Unternehmen monatlich verdient . Der Interquartilbereich kann ein effektiveres Werkzeug für die Datenanalyse sein als der Mittelwert oder der Median eines Datensatzes, da Sie damit den Dispersionsbereich und nicht nur eine einzelne Zahl identifizieren können.
TL; DR (zu lang; nicht gelesen)
Der Interquartilbereich (IQR) repräsentiert die mittleren 50 Prozent eines Datensatzes. Um dies zu berechnen, ordnen Sie zuerst Ihre Datenpunkte vom kleinsten zum größten und bestimmen dann Ihre erste und dritte Quartilposition mit den Formeln (N + 1) / 4 und 3 * (N + 1) / 4, wobei N die Zahl ist von Punkten im Datensatz. Subtrahieren Sie abschließend das erste Quartil vom dritten Quartil, um den Interquartilbereich für den Datensatz zu bestimmen.
Datenpunkte bestellen
Die Berechnung des Interquartilbereichs ist eine einfache Aufgabe, aber vor der Berechnung müssen Sie die verschiedenen Punkte Ihres Datensatzes anordnen. Beginnen Sie dazu damit, Ihre Datenpunkte von der niedrigsten zur höchsten zu ordnen. Wenn Ihre Datenpunkte beispielsweise 10, 19, 8, 4, 9, 12, 15, 11 und 20 wären, würden Sie sie folgendermaßen neu anordnen: {4, 8, 9, 10, 11, 12, 15, 19, 20}. Sobald Ihre Datenpunkte so bestellt wurden, können Sie mit dem nächsten Schritt fortfahren.
Bestimmen Sie die Position des ersten Quartils
Bestimmen Sie als Nächstes die Position des ersten Quartils mit der folgenden Formel: (N + 1) / 4, wobei N die Anzahl der Punkte im Datensatz ist. Wenn das erste Quartil zwischen zwei Zahlen liegt, nehmen Sie den Durchschnitt der beiden Zahlen als Ihre erste Quartilpunktzahl. Da es im obigen Beispiel neun Datenpunkte gibt, würden Sie 1 bis 9 addieren, um 10 zu erhalten, und dann durch 4 teilen, um 2,5 zu erhalten. Da das erste Quartil zwischen dem zweiten und dritten Wert liegt, würden Sie den Durchschnitt von 8 und 9 nehmen, um eine Position des ersten Quartils von 8,5 zu erhalten.
Bestimmen Sie die Position des dritten Quartils
Nachdem Sie Ihr erstes Quartil bestimmt haben, bestimmen Sie die Position des dritten Quartils mit der folgenden Formel: 3 * (N + 1) / 4 wobei N wieder die Anzahl der Punkte im Datensatz ist. Wenn das dritte Quartil zwischen zwei Zahlen liegt, nehmen Sie einfach den Durchschnitt wie bei der Berechnung des ersten Quartils. Da es im obigen Beispiel neun Datenpunkte gibt, würden Sie 1 bis 9 addieren, um 10 zu erhalten, mit 3 multiplizieren, um 30 zu erhalten, und dann durch 4 dividieren, um 7,5 zu erhalten. Da das erste Quartil zwischen dem siebten und achten Wert liegt, würden Sie den Durchschnitt von 15 und 19 nehmen, um ein drittes Quartil von 17 zu erhalten.
Interquartilbereich berechnen
Nachdem Sie Ihr erstes und drittes Quartil bestimmt haben, berechnen Sie den Interquartilbereich, indem Sie den Wert des ersten Quartils vom Wert des dritten Quartils abziehen. Um das im Verlauf dieses Artikels verwendete Beispiel zu beenden, würden Sie 8.5 von 17 subtrahieren und feststellen, dass der Interquartilbereich des Datensatzes 8.5 entspricht.
Vor- und Nachteile von IQR
Der Interquartilbereich hat den Vorteil, dass Ausreißer an beiden Enden eines Datensatzes identifiziert und eliminiert werden können. IQR ist auch ein gutes Maß für die Variation in Fällen von verzerrter Datenverteilung. Diese Methode zur Berechnung von IQR kann für gruppierte Datensätze verwendet werden, sofern Sie zur Organisation Ihrer Datenpunkte eine kumulative Häufigkeitsverteilung verwenden. Die Interquartilbereichsformel für gruppierte Daten ist dieselbe wie für nicht gruppierte Daten, wobei der IQR gleich dem Wert des ersten Quartils ist, der vom Wert des dritten Quartils abgezogen wird. Im Vergleich zur Standardabweichung weist es jedoch einige Nachteile auf: geringere Empfindlichkeit gegenüber einigen extremen Werten und eine Stichprobenstabilität, die nicht so stark ist wie die Standardabweichung.