Beschreibende Statistik/Absolute und Relative Häufigkeiten: Unterschied zwischen den Versionen

Aus ZUM-Unterrichten
main>Nina Krämer
(Die Seite wurde neu angelegt: „coming soon“)
 
main>Nina Krämer
Keine Bearbeitungszusammenfassung
Zeile 1: Zeile 1:
coming soon
Gerade bei großem Stichprobenumfang ist die Urliste nicht aussagekräftig. Hat man nicht zu viele verschiedene Merkmalsausprägungen, kann man die Häufigkeit festzustellen, mit der ein Merkmal eine bestimmte Ausprägung annimmt. Die Häufigkeit kann in '''absoluten Zahlen''' angegeben werden oder als '''relativer Anteil''' am Umfang der Stichprobe. Denken Sie immer daran, jede Aufbereitung soll die Daten aussagekräftiger machen. Meistens sollen die Daten eine Aussage unterstützen.
 
Gibt es sehr viele verschiedene Merkmalsausprägungen, so müssen die Merkmalsausprägungen zunächst zu Klassen zusammen gefasst werden. Dazu im nächsten Abschnitt mehr.
 
<!-- Beispiel absolute und relative Häufigkeiten -->
{|style="color: black; background-color: #FFFFE0;border-left:solid 2px #FFB90F;border-right:solid 2px #FFB90F;border-top:solid 2px #FFB90F;border-bottom:solid 2px #FFB90F;font-size:100%;font-size:100%;"
! align=left| <u>Beispiel "Alter der Lerngruppe"</u>:
|-
| Die Urliste zum Merkmal "Alter der Lerngruppe" hat einen Stichprobenumfang von <math>n=20</math> und enthält folgende Beobachtungswerte:
 
:: <math>18; 20; 17; 19; 16; 19; 19; 18; 17; 16; 20; 19; 19; 17; 19; 19; 16; 19; 17; 20</math>
 
Das Merkmal "Alter der Lerngruppe" hat <math>k=5</math> Merkmalsausprägungen, nämlich:
 
:: <math>16; 17; 18; 19; 20</math>
 
Jetzt lassen sich die absoluten Häufigkeiten leicht durch abzählen berechnen (ideal sind hier Strichlisten), man erhält:
 
<!-- Tabelle Auswertung Alter der Lerngruppe nach absoluten Häufigkeiten -->
<div style="float:left; margin-right:1em;">
{| class="wikitable"
|-
! '''Merkmalsausprägung''' <math>x_i</math> !! <math>16</math> !! <math>17</math> !! <math>18</math> !! <math>19</math> !! <math>20</math> !! Summe
|-
| '''absolute Häufigkeit''' <math>h(x_i)</math>|| <math>3</math> || <math>4</math> || <math>2</math> || <math>8</math> || <math>3</math> || <math>20</math>
|}
</div>
<!-- Tabelle Auswertung Alter der Lerngruppe nach absoluten Häufigkeiten -->
|-
| Diese Art die Beobachtungswerte zu präsentieren nennt man '''absolute Häufigkeitsverteilung'''.
 
Oft interessieren die genauen Zahlen aber gar nicht, sondern es geht nur um Anteile vom Ganzen. Berechnet man aus der absoluten Häufigkeitsverteilung jetzt die relativen Anteile der Merkmalsausprägungen bezogen auf den Stichprobenumfang, so erhält man die folgende Tabelle:
 
<!-- Tabelle Auswertung Alter der Lerngruppe nach relativen Häufigkeiten -->
<div style="float:left; margin-right:1em;">
{| class="wikitable"
|-
! Merkmalsausprägung <math>x_i</math> !! <math>16</math> !! <math>17</math> !! <math>18</math> !! <math>19</math> !! <math>20</math> !! Summe
|-
| absolute Häufigkeit <math>h(x_i)</math>|| <math>\frac{3}{20}=</math> || <math>\frac{4}{20}=</math> || <math>\frac{2}{20}=</math> || <math>\frac{8}{20}=</math> || <math>\frac{3}{20}=</math> || <math>1=</math>
|-
| oder als Dezimal- oder Prozentzahl || <math>0,15=15%</math> || <math>0,2=20%</math> || <math>0,1=10%</math> || <math>0,4=40%</math> || <math>0,15=15%</math> || <math>100%</math>
|}
<div>
<!-- Ende Tabelle Auswertung Alter der Lerngruppe nach relativen Häufigkeiten -->
|-
| Diese Art die Beobachtungswerte zu präsentieren nennt man '''relative Häufigkeitsverteilung'''.
 
 
 
Will man nicht mit Brüchen arbeiten, so hat es sich bewährt, Dezimalzahlen mit mindestens 3 Nachkommastellen darzustellen oder alternativ Prozentzahlen mit einer Dezimale. Aber oft sind die Darstellung als Bruch zu bevorzugen, weil es dann keine Rundungsdifferenzen gibt.
|}
<!-- Ende Beispiel absolute und relative Häufigkeiten -->
 
 
<!-- Definition absolute und relative Häufigkeiten -->
{{Merke-M||1=
Die <span style="background:yellow">'''absolute Häufigkeit'''</span> <math>H(x_i)</math> gibt die Anzahl aller Merkmalsträger mit dieser Merkmalsausprägung <math>x_i</math> an.
 
Statt <math>H(x_i)</math> schreibt man auch kurz <math>H_i</math>.
 
Die <span style="background:yellow">'''relative Häufigkeit'''</span> <math>h(x_i)=\frac{H(x_i)} {n}</math> gibt den Anteil aller Merkmalsträger mit dieser Merkmalsausprägung <math>x_i</math> bezogen auf den Stichprobenumfang <math>n</math> an.
 
Statt <math>h(x_i)</math> schreibt man auch kurz <math>h_i</math>.
}}
<!-- Ende Definition absolute und relative Häufigkeiten -->
 
 
<!-- Merksatz absolute und relative Häufigkeiten -->
{{Merke-M||1=
Die Summe der absoluten Häufigkeiten ist immer gleich der Anzahl aller Merkmalsträger, also gleich dem Stichprobenumfang.
 
Mathematische Kurzschreibweise:
 
:: <math>\sum_{i=1}^k H(x_i)=n</math> oder noch kürzer <math>\sum_{i=1}^k H_i=n</math>,
 
wobei <math>k</math> die Anzahl der Merkmalsausprägungen und <math>n</math> den Stichprobenumfang bezeichnen.
 
Eine Darstellung der Merkmalsausprägungen mit absoluten Häufigkeiten nennt man <span style="background:yellow">'''absolute Häufigkeitsverteilung'''</span>.
 
Die Summe der relativen Häufigkeiten ist immer gleich 1, also 100 %.
 
Mathematische Kurzschreibweise:
 
:: <math>\sum_{i=1}^k h(x_i)=1</math> oder noch kürzer <math>\sum_{i=1}^k h_i=1</math>,
 
wobei <math>k</math> die Anzahl der Merkmalsausprägungen und <math>n</math> den Stichprobenumfang bezeichnen.
 
Eine Darstellung der Merkmalsausprägungen mit relativen Häufigkeiten nennt man <span style="background:yellow">'''relative Häufigkeitsverteilung'''</span>.
}}
<!-- Ende Merksatz absolute und relative Häufigkeiten -->
 
 
[[Datei:Umfrage Eisdiele Urliste.PNG|rechts|Einführung Merkmale und Merkmalsausprägungen]]
<!-- Einführungsbeispiel Teil 5 -->
{|style="color: black; background-color: #FFFAFA;border-left:solid 2px #CD0000;border-right:solid 2px #CD0000;border-top:solid 2px #CD0000;border-bottom:solid 2px #CD0000;font-size:100%;font-size:100%;"
|colspan="4" |
<u>'''Einführungsbeispiel - Teil 5'''<br /></u>
 
Jetzt kann mit dem nächsten Schritt der Aufbereitung der Umfrage der Eisdiele "Rabe" begonnen werden. Hier soll das Merkmal "Geschlecht" mit absoluten und später mit relativen Häufigkeiten dargestellt werden.
 
Festgelegt wurde schon <math>x_1=m</math> für männlich und <math>x_2=w</math> für weiblich
 
<!-- Tabelle Auswertung Geschlecht absolute Häufigkeiten -->
<div style="float:left; margin-right:1em;">
{| class="wikitable"
| '''Merkmalsausprägung <math>x_i</math>''' || '''männlich''' || '''weiblich''' || '''Summe'''
|-
| '''absolute Häufigkeit <math>H(x_i)=H_i</math>||''' <math>12</math> || <math>18</math> || <math>30</math>
|}
<div>
|-
<!-- Ende Auswertung Geschlecht absolute Häufigkeiten -->
|colspan="4" |
Betrachtet man nun die relative Häufigkeit, so erhält man diese indem jede absolute Häufigkeit durch den Stichprobenumfang dividiert wird:
 
<!-- Tabelle Auswertung Geschlecht relative Häufigkeiten -->
<div style="float:left; margin-right:1em;">
{| class="wikitable"
| '''Merkmalsausprägung <math>x_i</math>''' || '''männlich''' || '''weiblich''' || '''Summe'''
|-
| '''relative Häufigkeit <math>h(x_i)=h_i</math>'''|| <math>\frac{12}{30}=0,4=40%</math> || <math>\frac{18}{30}=0,6=60%</math> || <math>1=100%</math>
|}
<div>
<!-- Ende Auswertung Geschlecht relative Häufigkeiten -->
|}
<!-- Ende Einführungsbeispiel Teil 5 -->

Version vom 7. April 2015, 20:55 Uhr

Gerade bei großem Stichprobenumfang ist die Urliste nicht aussagekräftig. Hat man nicht zu viele verschiedene Merkmalsausprägungen, kann man die Häufigkeit festzustellen, mit der ein Merkmal eine bestimmte Ausprägung annimmt. Die Häufigkeit kann in absoluten Zahlen angegeben werden oder als relativer Anteil am Umfang der Stichprobe. Denken Sie immer daran, jede Aufbereitung soll die Daten aussagekräftiger machen. Meistens sollen die Daten eine Aussage unterstützen.

Gibt es sehr viele verschiedene Merkmalsausprägungen, so müssen die Merkmalsausprägungen zunächst zu Klassen zusammen gefasst werden. Dazu im nächsten Abschnitt mehr.

Beispiel "Alter der Lerngruppe":
Die Urliste zum Merkmal "Alter der Lerngruppe" hat einen Stichprobenumfang von und enthält folgende Beobachtungswerte:

Das Merkmal "Alter der Lerngruppe" hat Merkmalsausprägungen, nämlich:

Jetzt lassen sich die absoluten Häufigkeiten leicht durch abzählen berechnen (ideal sind hier Strichlisten), man erhält:

Merkmalsausprägung Summe
absolute Häufigkeit
Diese Art die Beobachtungswerte zu präsentieren nennt man absolute Häufigkeitsverteilung.

Oft interessieren die genauen Zahlen aber gar nicht, sondern es geht nur um Anteile vom Ganzen. Berechnet man aus der absoluten Häufigkeitsverteilung jetzt die relativen Anteile der Merkmalsausprägungen bezogen auf den Stichprobenumfang, so erhält man die folgende Tabelle:

Merkmalsausprägung Summe
absolute Häufigkeit
oder als Dezimal- oder Prozentzahl Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle 0,15=15%} Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle 0,2=20%} Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle 0,1=10%} Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle 0,4=40%} Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle 0,15=15%} Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle 100%}
Diese Art die Beobachtungswerte zu präsentieren nennt man relative Häufigkeitsverteilung.


Will man nicht mit Brüchen arbeiten, so hat es sich bewährt, Dezimalzahlen mit mindestens 3 Nachkommastellen darzustellen oder alternativ Prozentzahlen mit einer Dezimale. Aber oft sind die Darstellung als Bruch zu bevorzugen, weil es dann keine Rundungsdifferenzen gibt.


Merke

Die absolute Häufigkeit gibt die Anzahl aller Merkmalsträger mit dieser Merkmalsausprägung an.

Statt schreibt man auch kurz .

Die relative Häufigkeit gibt den Anteil aller Merkmalsträger mit dieser Merkmalsausprägung bezogen auf den Stichprobenumfang an.

Statt schreibt man auch kurz .



Merke

Die Summe der absoluten Häufigkeiten ist immer gleich der Anzahl aller Merkmalsträger, also gleich dem Stichprobenumfang.

Mathematische Kurzschreibweise:

oder noch kürzer ,

wobei die Anzahl der Merkmalsausprägungen und den Stichprobenumfang bezeichnen.

Eine Darstellung der Merkmalsausprägungen mit absoluten Häufigkeiten nennt man absolute Häufigkeitsverteilung.

Die Summe der relativen Häufigkeiten ist immer gleich 1, also 100 %.

Mathematische Kurzschreibweise:

oder noch kürzer ,

wobei die Anzahl der Merkmalsausprägungen und den Stichprobenumfang bezeichnen.

Eine Darstellung der Merkmalsausprägungen mit relativen Häufigkeiten nennt man relative Häufigkeitsverteilung.


Einführung Merkmale und Merkmalsausprägungen

Einführungsbeispiel - Teil 5

Jetzt kann mit dem nächsten Schritt der Aufbereitung der Umfrage der Eisdiele "Rabe" begonnen werden. Hier soll das Merkmal "Geschlecht" mit absoluten und später mit relativen Häufigkeiten dargestellt werden.

Festgelegt wurde schon für männlich und für weiblich

Merkmalsausprägung männlich weiblich Summe
absolute Häufigkeit

Betrachtet man nun die relative Häufigkeit, so erhält man diese indem jede absolute Häufigkeit durch den Stichprobenumfang dividiert wird:

Merkmalsausprägung männlich weiblich Summe
relative Häufigkeit Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle \frac{12}{30}=0,4=40%} Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle \frac{18}{30}=0,6=60%} Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle 1=100%}