Inhalt
- Schnelle Datenvisualisierung
- Relative Fülle sichtbar machen
- Komplexe Datensätze müssen möglicherweise in Intervalle eingeteilt werden
- Frequenztabellen können Schrägstellung und Kurtosis verdecken
Häufigkeitstabellen können nützlich sein, um die Anzahl der Vorkommen eines bestimmten Datentyps in einem Datensatz zu beschreiben. Häufigkeitstabellen, auch Häufigkeitsverteilungen genannt, sind eines der grundlegendsten Tools für die Anzeige deskriptiver Statistiken. Häufigkeitstabellen werden häufig als Referenz für die Verteilung von Daten auf einen Blick verwendet. Sie sind einfach zu interpretieren und können große Datenmengen ziemlich übersichtlich darstellen. Häufigkeitstabellen können dabei helfen, offensichtliche Trends in einem Datensatz zu identifizieren, und können zum Vergleichen von Daten zwischen Datensätzen desselben Typs verwendet werden. Die Häufigkeitstabellen sind jedoch nicht für jede Anwendung geeignet. Sie können Extremwerte (mehr als X oder weniger als Y) verschleiern und eignen sich nicht für Analysen des Versatzes und der Kurtosis der Daten.
Schnelle Datenvisualisierung
In Frequenztabellen können Ausreißer und sogar signifikante Trends innerhalb eines Datensatzes mit nur einer flüchtigen Prüfung schnell aufgedeckt werden. Zum Beispiel kann ein Lehrer die Noten der Schüler auf einer Häufigkeitstabelle mittelfristig anzeigen, um einen schnellen Überblick über die Gesamtleistung seiner Klasse zu erhalten. Die Zahl in der Frequenzspalte gibt die Anzahl der Schüler an, die diese Note erhalten. Für eine Klasse mit 25 Schülern könnte die Häufigkeitsverteilung der erhaltenen Buchstaben ungefähr so ​​aussehen: Klassenhäufigkeit A .............. 7 B ........... ..13 C .............. 3 D .............. 2
Relative Fülle sichtbar machen
Mithilfe von Häufigkeitstabellen können Forscher die relative Häufigkeit der einzelnen Zieldaten in ihrer Stichprobe untersuchen. Die relative Häufigkeit gibt an, wie viel des Datensatzes aus den Zieldaten besteht. Die relative Häufigkeit wird häufig als Frequenzhistogramm dargestellt, kann jedoch problemlos in einer Häufigkeitstabelle angezeigt werden. Betrachten Sie die gleiche Häufigkeitsverteilung der mittleren Klassen. Die relative Häufigkeit ist einfach der Prozentsatz der Schüler, die eine bestimmte Note erreicht haben, und kann hilfreich sein, um Daten zu konzipieren, ohne sie zu überdenken. Anhand der hinzugefügten Spalte, in der die prozentuale Häufigkeit jeder Note angezeigt wird, können Sie leicht erkennen, dass mehr als die Hälfte der Klasse ein B erzielt hat, ohne dass die Daten eingehend geprüft werden müssen.
Grad Frequenz Relative Häufigkeit (% Häufigkeit) A .............. 7 .............. 28% B ......... .... 13 ............ 52% C .............. 3 ............. 12% D .............. 2 .............. 8%
Komplexe Datensätze müssen möglicherweise in Intervalle eingeteilt werden
Ein Nachteil ist, dass es schwierig ist, komplexe Datensätze zu erfassen, die in einer Häufigkeitstabelle angezeigt werden. Große Datensätze können zur einfachen Visualisierung mithilfe einer Häufigkeitstabelle in Intervallklassen unterteilt werden. Wenn Sie beispielsweise die nächsten 100 Personen nach ihrem Alter fragen, erhalten Sie wahrscheinlich eine breite Palette von Antworten, die zwischen drei und dreiundneunzig liegen. Anstatt Zeilen für jedes Alter in Ihre Häufigkeitstabelle aufzunehmen, können Sie die Daten in Intervalle einteilen, z. B. 0 - 10 Jahre, 11 - 20 Jahre, 21 - 30 Jahre usw. Dies kann auch als gruppierte Häufigkeitsverteilung bezeichnet werden.
Frequenztabellen können Schrägstellung und Kurtosis verdecken
Wenn dies nicht auf einem Histogramm angezeigt wird, sind die Schiefe und die Kurtosis von Daten in einer Häufigkeitstabelle möglicherweise nicht ohne weiteres erkennbar. Die Schiefe gibt an, in welche Richtung Ihre Daten tendieren. Wenn die Noten auf der X-Achse eines Diagramms angezeigt würden, das die Häufigkeit der Zwischennoten für unsere 25 Schüler oben zeigt, würde sich die Verteilung in Richtung As und Bs verschieben. Kurtosis gibt Auskunft über die zentrale Spitze Ihrer Daten - ob sie einer Normalverteilung entsprechen würden, die eine schöne glatte Glockenkurve darstellt, oder ob sie hoch und scharf sind. Wenn Sie die mittleren Noten in unserem Beispiel grafisch darstellen, finden Sie einen hohen Peak bei B mit einem starken Abfall in der Verteilung der niedrigeren Noten.