Beschreibende Statistik/Absolute und Relative Häufigkeiten

Aus ZUM-Unterrichten

Gerade bei großem Stichprobenumfang ist die Urliste nicht aussagekräftig. Hat man nicht zu viele verschiedene Merkmalsausprägungen, kann man die Häufigkeit festzustellen, mit der ein Merkmal eine bestimmte Ausprägung annimmt. Die Häufigkeit kann in absoluten Zahlen angegeben werden oder als relativer Anteil am Umfang der Stichprobe. Denken Sie immer daran, jede Aufbereitung soll die Daten aussagekräftiger machen. Meistens sollen die Daten eine Aussage unterstützen.

Gibt es sehr viele verschiedene Merkmalsausprägungen, so müssen die Merkmalsausprägungen zunächst zu Klassen zusammen gefasst werden. Dazu im nächsten Abschnitt mehr.

Beispiel "Alter der Lerngruppe":
Die Urliste zum Merkmal "Alter der Lerngruppe" hat einen Stichprobenumfang von und enthält folgende Beobachtungswerte:

Das Merkmal "Alter der Lerngruppe" hat Merkmalsausprägungen, nämlich:

Jetzt lassen sich die absoluten Häufigkeiten leicht durch abzählen berechnen (ideal sind hier Strichlisten), man erhält:

Merkmalsausprägung Summe
absolute Häufigkeit
Diese Art die Beobachtungswerte zu präsentieren nennt man absolute Häufigkeitsverteilung.

Oft interessieren die genauen Zahlen aber gar nicht, sondern es geht nur um Anteile vom Ganzen. Berechnet man aus der absoluten Häufigkeitsverteilung jetzt die relativen Anteile der Merkmalsausprägungen bezogen auf den Stichprobenumfang, so erhält man die folgende Tabelle:

Merkmalsausprägung Summe
absolute Häufigkeit
oder als Dezimal- oder Prozentzahl Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle 0,15=15%} Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle 0,2=20%} Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle 0,1=10%} Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle 0,4=40%} Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle 0,15=15%} Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle 100%}
Diese Art die Beobachtungswerte zu präsentieren nennt man relative Häufigkeitsverteilung.


Will man nicht mit Brüchen arbeiten, so hat es sich bewährt, Dezimalzahlen mit mindestens 3 Nachkommastellen darzustellen oder alternativ Prozentzahlen mit einer Dezimale. Aber oft sind die Darstellung als Bruch zu bevorzugen, weil es dann keine Rundungsdifferenzen gibt.


Merke

Die absolute Häufigkeit gibt die Anzahl aller Merkmalsträger mit dieser Merkmalsausprägung an.

Statt schreibt man auch kurz .

Die relative Häufigkeit gibt den Anteil aller Merkmalsträger mit dieser Merkmalsausprägung bezogen auf den Stichprobenumfang an.

Statt schreibt man auch kurz .


Merke

Die Summe der absoluten Häufigkeiten ist immer gleich der Anzahl aller Merkmalsträger, also gleich dem Stichprobenumfang.

Mathematische Kurzschreibweise:

oder noch kürzer ,

wobei die Anzahl der Merkmalsausprägungen und den Stichprobenumfang bezeichnen.

Eine Darstellung der Merkmalsausprägungen mit absoluten Häufigkeiten nennt man absolute Häufigkeitsverteilung.

Die Summe der relativen Häufigkeiten ist immer gleich 1, also 100 %.

Mathematische Kurzschreibweise:

oder noch kürzer ,

wobei die Anzahl der Merkmalsausprägungen und den Stichprobenumfang bezeichnen.

Eine Darstellung der Merkmalsausprägungen mit relativen Häufigkeiten nennt man relative Häufigkeitsverteilung.


Einführung Merkmale und Merkmalsausprägungen

Einführungsbeispiel - Teil 5

Jetzt kann mit dem nächsten Schritt der Aufbereitung der Umfrage der Eisdiele "Rabe" begonnen werden. Hier soll das Merkmal "Geschlecht" mit absoluten und später mit relativen Häufigkeiten dargestellt werden.

Festgelegt wurde schon für männlich und für weiblich

Merkmalsausprägung männlich weiblich Summe
absolute Häufigkeit

Betrachtet man nun die relative Häufigkeit, so erhält man diese indem jede absolute Häufigkeit durch den Stichprobenumfang dividiert wird:

Merkmalsausprägung männlich weiblich Summe
relative Häufigkeit Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle \frac{12}{30}=0,4=40%} Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle \frac{18}{30}=0,6=60%} Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle 1=100%}