Beschreibende Statistik/Klassenbildung: Unterschied zwischen den Versionen
main>Nina Krämer Keine Bearbeitungszusammenfassung |
Keine Bearbeitungszusammenfassung Markierung: 2017-Quelltext-Bearbeitung |
||
(22 dazwischenliegende Versionen von 5 Benutzern werden nicht angezeigt) | |||
Zeile 1: | Zeile 1: | ||
'''Lernziele:''' | |||
*Sie kennen die Definitionen (und mathematischen Bezeichnungen) der Begriffe | |||
**Klassenanzahl, | |||
**Spannweite und | |||
**Klassenbreite. | |||
*Sie können entscheiden, ob vorliegende Daten zu klassieren sind, um sie aussagekräftig darzustellen. | |||
*Sie können | |||
**Klassenanzahlen, | |||
**die Spannweite und | |||
**Klassenbreiten im Sachzusammenhang berechnen. | |||
*Sie kennen den Unterschied zwischen | |||
**Klassen mit gleicher Klassenbreite und | |||
**Klassen mit unterschiedlicher Klassenbreite. | |||
*Sie können situativ entscheiden, welche Art von Klassenbildung für die Lösung einer Aufgabe geeignet ist. | |||
Sie kennen das alles schon? Dann geht es hier direkt zu den Übungen [[Datei:Pfeil 2.gif]] [[#Übungen |Übungen]] | |||
Man kann jede Art von Merkmalen klassieren. Das geht sogar bei qualitativen Merkmalen mit einer Nominalskala. | Man kann jede Art von Merkmalen klassieren. Das geht sogar bei qualitativen Merkmalen mit einer Nominalskala. | ||
===Beispiel Merkmal Lieblingsfarbe=== | |||
Sind zum Beispiel die Farben hellgelb, gelb, sonnengelb, rot, grün, hellblau, mittelblau, himmelblau und dunkelblau unter den Merkmalsausprägungen, so könnte man die Klassen | |||
: "'''gelb'''" mit den Merkmalsausprägungen hellgelb, gelb und sonnengelb, | :"'''gelb'''" mit den Merkmalsausprägungen hellgelb, gelb und sonnengelb, | ||
: "'''blau'''" mit den Merkmalsausprägungen hellblau, mittelblau, himmelblau und dunkelblau , | :"'''blau'''" mit den Merkmalsausprägungen hellblau, mittelblau, himmelblau und dunkelblau , | ||
: "'''Andere'''" mit den verbliebenden Merkmalsausprägungen bilden. | :"'''Andere'''" mit den verbliebenden Merkmalsausprägungen bilden. | ||
Dies wird auch bei der Auswertung von Wahlergebnissen im Fernsehen gemacht, die kleineren, nicht so wichtigen Parteien werden unter "Andere" zusammengefasst. | Dies wird auch bei der Auswertung von Wahlergebnissen im Fernsehen gemacht, die kleineren, nicht so wichtigen Parteien werden unter "Andere" zusammengefasst. | ||
<!-- Ende Beispiel Merkmal Lieblingsfarbe --> | <!-- Ende Beispiel Merkmal Lieblingsfarbe --> | ||
Bei qualitativen Merkmalen mit einer Ordinalskala wird man immer darauf achten, dass aufeinander folgende Merkmalsausprägungen zusammengefasst werden. | Bei qualitativen Merkmalen mit einer Ordinalskala wird man immer darauf achten, dass aufeinander folgende Merkmalsausprägungen zusammengefasst werden. | ||
===Beispiel Merkmal Note Mathematikarbeit=== | |||
Betrachtet man die Noten der letzten Mathematikarbeit, so könnte man die Klassen | |||
:"'''Leistungsträger'''" für die Merkmalsausprägungen "sehr gut" und "gut", | |||
:"'''Mittelfeld'''" für die Merkmalsausprägungen "befriedigend" und "ausreichend" und | |||
: "'''Leistungsträger'''" für die Merkmalsausprägungen "sehr gut" und "gut", | :"'''Blauer Brief'''" für die Merkmalsausprägungen "mangelhaft" und "ungenügend" bilden, | ||
: "'''Mittelfeld'''" für die Merkmalsausprägungen "befriedigend" und "ausreichend" und | |||
: "'''Blauer Brief'''" für die Merkmalsausprägungen "mangelhaft" und "ungenügend" bilden, | |||
um eine knappe Übersicht über die Lerngruppe zu erhalten. | um eine knappe Übersicht über die Lerngruppe zu erhalten. | ||
<!-- Ende Beispiel Merkmal Note Mathematikarbeit --> | <!-- Ende Beispiel Merkmal Note Mathematikarbeit --> | ||
Zeile 36: | Zeile 49: | ||
Nicht immer macht es Sinn, alle verschiedenen Merkmalsausprägungen einzeln zu betrachten. Bei quantitativen Merkmalen fasst man oft verschiedene Merkmalsausprägungen zu Klassen zusammen. | Nicht immer macht es Sinn, alle verschiedenen Merkmalsausprägungen einzeln zu betrachten. Bei quantitativen Merkmalen fasst man oft verschiedene Merkmalsausprägungen zu Klassen zusammen. | ||
===Beispiel Körpergröße (in cm)=== | |||
<!-- Tabelle Körpergröße HHU5 --> | <!-- Tabelle Körpergröße HHU5 --> | ||
<div style="float: | <div style="float:right; margin-left:1em;"> | ||
{| class="wikitable" | {| class="wikitable" | ||
|+ Urliste | |+Urliste | ||
! colspan="5"| Körpergröße in cm | ! colspan="5" |Körpergröße in cm | ||
|- | |- | ||
| 170 || 178 || 174 || 188 || 168 | |170||178||174||188||168 | ||
|- | |- | ||
| 191 || 169 || 159 || 199 || 200 | |191||169||159||199||200 | ||
|- | |- | ||
| 177 || 178 || 200 || 193 || 169 | |177||178||200||193||169 | ||
|- | |- | ||
| 151 || 185 || 191 || 165 || 158 | |151||185||191||165||158 | ||
|- | |- | ||
| 185 || 188 || 194 || 180 || 170 | |185||188||194||180||170 | ||
|} | |} | ||
</div> | </div> | ||
<!-- Ende Tabelle Körpergröße HHU5 --> | <!-- Ende Tabelle Körpergröße HHU5 --> | ||
Betrachtet man zum Beispiel die Körpergröße (in cm) der Schüler und Schülerinnen der Klasse HHU5 am Berufskolleg Hattingen (Schuljahr 2012/2013): | |||
Zeile 68: | Zeile 78: | ||
Dann ist es sinnvoll, eine absolute Häufigkeitsverteilung mit drei verschiedenen Klassen zu bilden. Jede Klasse hat eine untere und eine obere Grenze. Wichtig ist, dass sich die Klassen nicht überschneiden, damit jeder Beobachtungswert nur genau zu einer Klasse gehört. | Dann ist es sinnvoll, eine absolute Häufigkeitsverteilung mit drei verschiedenen Klassen zu bilden. Jede Klasse hat eine untere und eine obere Grenze. Wichtig ist, dass sich die Klassen nicht überschneiden, damit jeder Beobachtungswert nur genau zu einer Klasse gehört. | ||
==Klasseneinteilung== | |||
Klasse <math>k_1</math>: | Klasse <math>k_1</math>: | ||
:vom kleinsten Wert <math>x_{Min}</math> (hier: 151 cm) bis zu 175 cm einschließlich | :vom kleinsten Wert <math>x_{Min}</math> (hier: 151 cm) bis zu 175 cm einschließlich | ||
:: mathematische Kurzschreibweise: <math>[151;175]=]150;175]</math> | ::mathematische Kurzschreibweise: <math>[151;175]=]150;175]</math> | ||
Klasse <math>k_2</math>: | Klasse <math>k_2</math>: | ||
: von über 175 cm bis zu 183 cm einschließlich | |||
:: mathematische Kurzschreibweise: <math>]175;183]</math> | :von über 175 cm bis zu 183 cm einschließlich | ||
::mathematische Kurzschreibweise: <math>]175;183]</math> | |||
Klasse <math>k_3</math>: | Klasse <math>k_3</math>: | ||
:von über 183 cm bis zum größten Wert <math>x_{Max}</math> (hier 200 cm) einschließlich | :von über 183 cm bis zum größten Wert <math>x_{Max}</math> (hier 200 cm) einschließlich | ||
:: mathematische Kurzschreibweise: <math>]183;200]</math> | ::mathematische Kurzschreibweise: <math>]183;200]</math> | ||
===Häufigkeitsverteilung bestimmen=== | |||
Jetzt kann man die absolute Häufigkeit <math>H(k_i)</math> zu jeder Klasse <math>k_i</math> bestimmen, indem man alle Beobachtungswerte zählt, die im Intervall der Klasse <math>k_i</math> liegen. | Jetzt kann man die absolute Häufigkeit <math>H(k_i)</math> zu jeder Klasse <math>k_i</math> bestimmen, indem man alle Beobachtungswerte zählt, die im Intervall der Klasse <math>k_i</math> liegen. | ||
Zeile 91: | Zeile 105: | ||
{| class="wikitable" | {| class="wikitable" | ||
|- | |- | ||
! colspan="5" | Klassierte Körpergrößen HHU5 2012/2013 | ! colspan="5" |Klassierte Körpergrößen HHU5 2012/2013 | ||
|- | |- | ||
| <math>k_i</math> || <math>150 < a_i \le 175</math> || <math>175 < a_i \le 183</math> || <math>183 < a_i \le 200</math> || '''Summe''' | |<math>k_i</math>||<math>150 < a_i \le 175</math>||<math>175 < a_i \le 183</math>||<math>183 < a_i \le 200</math>||'''Summe''' | ||
|- | |- | ||
| <math>H(k_i)</math> || <math>10</math> || <math>4</math> || <math>11</math> || <math>25</math> | |<math>H(k_i)</math>||<math>10</math>||<math>4</math>||<math>11</math>||<math>25</math> | ||
|- | |- | ||
| <math>h(k_i)</math> || <math>\frac{2}{5}=40 %</math> || <math>\frac{4}{25}=16 %</math> || <math>\frac{11}{25}=44 %</math> || <math>100 %</math> | |<math>h(k_i)</math>||<math>\frac{2}{5}=40 %</math>||<math>\frac{4}{25}=16 %</math>||<math>\frac{11}{25}=44 %</math>||<math>100 %</math> | ||
|} | |} | ||
<!-- Ende Klassierte Tabelle Körpergröße HHU5 --> | |||
</div> | </div> | ||
===Interpretation=== | |||
Es sind also nicht nur vier Schüler größer als 175 cm und höchstens 183 cm. Es sieht so aus, als wären die Schüler der Klasse entweder klein oder groß, weil die Klasse in der Mitte so selten vertreten ist. | Es sind also nicht nur vier Schüler größer als 175 cm und höchstens 183 cm. Es sieht so aus, als wären die Schüler der Klasse entweder klein oder groß, weil die Klasse in der Mitte so selten vertreten ist. | ||
Zeile 109: | Zeile 123: | ||
Stimmt das denn? | Stimmt das denn? | ||
Hier ist es hilfreich, sich mit den Klassenbreiten zu beschäftigen. | Hier ist es hilfreich, sich mit den Klassenbreiten zu beschäftigen. | ||
===Klassenbreiten bestimmen=== | |||
Die gewählten Klassen <math>k_i</math> sind unterschiedlich breit. Die Breite <math>b_i</math> einer Klasse <math>k_i</math> errechnet man, indem man die untere Grenze <math>uG_i</math> von der oberen Grenze <math>oG_i</math> subtrahiert. | Die gewählten Klassen <math>k_i</math> sind unterschiedlich breit. Die Breite <math>b_i</math> einer Klasse <math>k_i</math> errechnet man, indem man die untere Grenze <math>uG_i</math> von der oberen Grenze <math>oG_i</math> subtrahiert. | ||
Zeile 123: | Zeile 136: | ||
{| class="wikitable" | {| class="wikitable" | ||
|- | |- | ||
! Klasse <math>k_i</math> !! untere Grenze <math>uG_i</math> !! obere Grenze <math>oG_i</math> !! Klassenbreite <math>b_i</math> | !Klasse <math>k_i</math>!!untere Grenze <math>uG_i</math>!!obere Grenze <math>oG_i</math>!!Klassenbreite <math>b_i</math> | ||
|- | |- | ||
| <math>k_1</math> || <math>150</math> || <math>175</math> || <math>175-150=25</math> | |<math>k_1</math>||<math>150</math>||<math>175</math>||<math>175-150=25</math> | ||
|- | |- | ||
| <math>k_2</math> || <math>175</math> || <math>183</math> || <math>183-175=8</math> | |<math>k_2</math>||<math>175</math>||<math>183</math>||<math>183-175=8</math> | ||
|- | |- | ||
| <math>k_3</math> || <math>183</math> || <math>200</math> || <math>200-183=17</math> | |<math>k_3</math>||<math>183</math>||<math>200</math>||<math>200-183=17</math> | ||
|} | |} | ||
</div> | </div> | ||
<!-- Ende Klassenbreiten --> | <!-- Ende Klassenbreiten --> | ||
<br> | |||
Jetzt sieht man, dass die mittlere Klasse auch viel schmaler ist, als die beiden anderen Klassen. Die Klassenbreite hat aber Einfluss auf die Häufigkeit, mit der die Beobachtungswerte in der Klasse liegen. Deshalb wählt man in der Regel Klassen mit gleicher Klassenbreite. Nur in Ausnahmefällen machen Klassen mit unterschiedlichen Klassenbreiten Sinn. Ganz besonders gut geeignet sind unterschiedliche Klassenbreiten, wenn man schon vorher weiß, welche Aussage man mit den Daten unterstützen möchte. | Jetzt sieht man, dass die mittlere Klasse auch viel schmaler ist, als die beiden anderen Klassen. Die Klassenbreite hat aber Einfluss auf die Häufigkeit, mit der die Beobachtungswerte in der Klasse liegen. Deshalb wählt man in der Regel Klassen mit gleicher Klassenbreite. Nur in Ausnahmefällen machen Klassen mit unterschiedlichen Klassenbreiten Sinn. Ganz besonders gut geeignet sind unterschiedliche Klassenbreiten, wenn man schon vorher weiß, welche Aussage man mit den Daten unterstützen möchte. | ||
Zeile 144: | Zeile 157: | ||
{| class="wikitable" | {| class="wikitable" | ||
|- | |- | ||
! colspan="4" | Klassierte Körpergrößen HHU5 2012/2013 | ! colspan="4" |Klassierte Körpergrößen HHU5 2012/2013 | ||
|- | |- | ||
! Klasse <math>k_i</math> !! Intervall !! <math>H(k_i)</math> || <math>h(k_i)</math> | !Klasse <math>k_i</math>!!Intervall!!<math>H(k_i)</math>||<math>h(k_i)</math> | ||
|- | |- | ||
| <math>k_1</math> || <math>143 < a_i \le 151</math> || <math>1</math> || <math>\frac{1}{25}=4 %</math> | |<math>k_1</math>||<math>143 < a_i \le 151</math>||<math>1</math>||<math>\frac{1}{25}=4 %</math> | ||
|- | |- | ||
| <math>k_2</math> || <math>151 < a_i \le 159</math> || <math>2</math> || <math>\frac{2}{25}=8 %</math> | |<math>k_2</math>||<math>151 < a_i \le 159</math>||<math>2</math>||<math>\frac{2}{25}=8 %</math> | ||
|- | |- | ||
| <math>k_3</math> || <math>159 < a_i \le 167</math> || <math>1</math> || <math>\frac{1}{25}=4 %</math> | |<math>k_3</math>||<math>159 < a_i \le 167</math>||<math>1</math>||<math>\frac{1}{25}=4 %</math> | ||
|- | |- | ||
| <math>k_4</math> || <math>167 < a_i \le 175</math> || <math>6</math> || <math>\frac{6}{25}=24 %</math> | |<math>k_4</math>||<math>167 < a_i \le 175</math>||<math>6</math>||<math>\frac{6}{25}=24 %</math> | ||
|- | |- | ||
| <math>k_5</math> || <math>175 < a_i \le 183</math> || <math>4</math> || <math>\frac{4}{25}=16 %</math> | |<math>k_5</math>||<math>175 < a_i \le 183</math>||<math>4</math>||<math>\frac{4}{25}=16 %</math> | ||
|- | |- | ||
| <math>k_6</math> || <math>183 < a_i \le 191</math> || <math>6</math> || <math>\frac{6}{25}=24 %</math> | |<math>k_6</math>||<math>183 < a_i \le 191</math>||<math>6</math>||<math>\frac{6}{25}=24 %</math> | ||
|- | |- | ||
| <math>k_7</math> || <math>191 < a_i \le 199</math> || <math>3</math> || <math>\frac{3}{25}=12 %</math> | |<math>k_7</math>||<math>191 < a_i \le 199</math>||<math>3</math>||<math>\frac{3}{25}=12 %</math> | ||
|- | |- | ||
| <math>k_8</math> || <math>199 < a_i \le 207</math> || <math>2</math> || <math>\frac{2}{25}=8 %</math> | |<math>k_8</math>||<math>199 < a_i \le 207</math>||<math>2</math>||<math>\frac{2}{25}=8 %</math> | ||
|- | |- | ||
! colspan="2"| Summe !! <math>25</math> !! <math>100%</math> | ! colspan="2" |Summe!!<math>25</math>!!<math>100%</math> | ||
|} | |} | ||
</div> | </div> | ||
<!-- Ende Klassierte Tabelle Körpergröße HHU5 --> | <!-- Ende Klassierte Tabelle Körpergröße HHU5 --> | ||
<br> | |||
===Interpretation=== | |||
Man kann leicht erkennen, dass es - unter Berücksichtigung der Klassenbreite - nur zwei Klassen gibt, in denen sich mehr Beobachtungswerte befinden. So erhält man also ein ganz anderes Bild der Verteilung. | Man kann leicht erkennen, dass es - unter Berücksichtigung der Klassenbreite - nur zwei Klassen gibt, in denen sich mehr Beobachtungswerte befinden. So erhält man also ein ganz anderes Bild der Verteilung. | ||
<!-- Beispiel Körpergröße (in cm) --> | <!-- Beispiel Körpergröße (in cm) --> | ||
{{Box|1=Merke|2=Wenn bei einer umfangreichen Stichprobe sehr viele unterschiedliche Merkmalsausprägungen auftreten, so bietet es sich an, ähnliche Werte in sogenannte <span style="background:yellow">'''Klassen <math>k_i</math>'''</span> der <span style="background:yellow">(Klassen-)Breite <math>b_i</math></span> zusammenzufassen.|3=Merksatz}} | |||
{{Merke | |||
Wenn bei einer umfangreichen Stichprobe sehr viele unterschiedliche Merkmalsausprägungen auftreten, so bietet es sich an, ähnliche Werte in sogenannte <span style="background:yellow">'''Klassen <math>k_i</math>'''</span> der <span style="background:yellow">(Klassen-)Breite <math>b_i</math></span> zusammenzufassen. | |||
}} | |||
<!-- Ende Merke Klassen --> | <!-- Ende Merke Klassen --> | ||
Man unterscheidet zwei Arten von Klassenbildungen: | Man unterscheidet zwei Arten von Klassenbildungen: | ||
*: Klassen mit gleicher Klassenbreite <math>b_i=b</math> | |||
*: Klassen mit unterschiedlicher Klassenbreite <math>b_i</math> | *:Klassen mit gleicher Klassenbreite <math>b_i=b</math> | ||
*:Klassen mit unterschiedlicher Klassenbreite <math>b_i</math> | |||
Übrigens eignen sich Klassen mit unterschiedlicher Klassenbreite hervorragend, um Daten so aufzubereiten, dass sie die gewünschte Aussage (hier entweder eine Klasse mit besonders großen Schülern oder mit besonders kleinen Schülern) gut unterstützen. Hier gilt der allseits beliebte Spruch: "Traue keiner Statistik, die du nicht selbst gefälscht hast." | Übrigens eignen sich Klassen mit unterschiedlicher Klassenbreite hervorragend, um Daten so aufzubereiten, dass sie die gewünschte Aussage (hier entweder eine Klasse mit besonders großen Schülern oder mit besonders kleinen Schülern) gut unterstützen. Hier gilt der allseits beliebte Spruch: "Traue keiner Statistik, die du nicht selbst gefälscht hast." | ||
{{Aufgabe| | |||
Sie haben Ihr Regelheft mit dem sechsten Merksatz gefüllt. | |||
}} | |||
{{Fortsetzung|weiter=Klassen mit gleicher Klassenbreite|weiterlink=Beschreibende Statistik/Klassenbildung/Klassen mit gleicher Klassenbreite}} | |||
==Übungen== | |||
'''Ordnen Sie die mathematischen Bezeichnungen und Formeln richtig zu.''' | |||
<div class="zuordnungs-quiz"> | |||
{| | |||
|Klassen||<math>k_i</math>||haben eine obere Grenze||haben eine untere Grenze | |||
|- | |||
|Klassenbreite||<math>b_i</math>||Spannweite geteilt durch Klassenanzahl||<math>\frac{R}{k}</math>||<math>b</math> | |||
|- | |||
|Spannweite||<math>R</math>||<math>x_{Max}-x_{Min}</math>||Differenz aus größter und kleinster Merkmalsausprägung | |||
|- | |||
|Klassenanzahl||<math>k</math>||<math>\sqrt{n}</math>||Wurzel aus dem Stichprobenumfang | |||
|- | |||
|größte Merkmalsausprägung||<math>x_{Max}</math> | |||
|- | |||
|kleinste Merkmalsausprägung||<math>x_{Min}</math> | |||
|} | |||
</div> | |||
{{Aufgabe|Die PurFrucht Gmbh stellt auch Orangensaft her. Ein neuer Lieferant behauptet, dass sich aus einer 250 g schweren Orange 50 ml Saft herauspressen lässt. Eine Überprüfung von gleich schweren Orangen lieferte diese Ergebnisse [ml]: | |||
<pre> | |||
52,5; 51,7; 52,3; 50,9; 48,8; 51,4; 48,3; | |||
52,2; 51,4; 50,7; 50,8; 52,0; 48,4; 50,0; | |||
51,4; 49,1; 47,5; 51,5; 48,7; 51,3; 47,9; | |||
49,5; 49,9; 50,1; 50,2; 52,4; 52,0; 50,1; | |||
49,9; 51,9; 48,7; 51,4; 52,4; 47,9; 51,0; | |||
48,9; 50,2; 48,0; 51,5; 49,8; 49,1; 48,4; | |||
51,7; 51,1; 51,2; 51,5; 48,3; 51,5; 51,1 | |||
</pre> | |||
Klassieren Sie die Daten und stellen Sie die absoluten und relativen Häufigkeitsverteilung auf und geben Sie an, was in diesem Fall Merkmalsträger, Merkmal und Merkmalsausprägung ist. | |||
Entscheiden Sie begründet, ob der Lieferant vertrauenswürdig ist. | |||
}} | |||
{{Aufgabe| | |||
Sie haben die Aufgaben erfolgreich gelöst? | |||
Hier geht's weiter. [[Datei:Pfeil 2.gif]] [[../../Lernpfad zur Beschreibenden Statistik|Startseite des Lernpfads]] | |||
}} | |||
{{Fortsetzung|weiter=Klassen mit gleicher Klassenbreite|weiterlink=Beschreibende Statistik/Klassenbildung/Klassen mit gleicher Klassenbreite}} | |||
{{Beschreibende Statistik}} |
Aktuelle Version vom 14. Oktober 2022, 06:29 Uhr
Lernziele:
- Sie kennen die Definitionen (und mathematischen Bezeichnungen) der Begriffe
- Klassenanzahl,
- Spannweite und
- Klassenbreite.
- Sie können entscheiden, ob vorliegende Daten zu klassieren sind, um sie aussagekräftig darzustellen.
- Sie können
- Klassenanzahlen,
- die Spannweite und
- Klassenbreiten im Sachzusammenhang berechnen.
- Sie kennen den Unterschied zwischen
- Klassen mit gleicher Klassenbreite und
- Klassen mit unterschiedlicher Klassenbreite.
- Sie können situativ entscheiden, welche Art von Klassenbildung für die Lösung einer Aufgabe geeignet ist.
Sie kennen das alles schon? Dann geht es hier direkt zu den Übungen Übungen
Man kann jede Art von Merkmalen klassieren. Das geht sogar bei qualitativen Merkmalen mit einer Nominalskala.
Beispiel Merkmal Lieblingsfarbe
Sind zum Beispiel die Farben hellgelb, gelb, sonnengelb, rot, grün, hellblau, mittelblau, himmelblau und dunkelblau unter den Merkmalsausprägungen, so könnte man die Klassen
- "gelb" mit den Merkmalsausprägungen hellgelb, gelb und sonnengelb,
- "blau" mit den Merkmalsausprägungen hellblau, mittelblau, himmelblau und dunkelblau ,
- "Andere" mit den verbliebenden Merkmalsausprägungen bilden.
Dies wird auch bei der Auswertung von Wahlergebnissen im Fernsehen gemacht, die kleineren, nicht so wichtigen Parteien werden unter "Andere" zusammengefasst.
Bei qualitativen Merkmalen mit einer Ordinalskala wird man immer darauf achten, dass aufeinander folgende Merkmalsausprägungen zusammengefasst werden.
Beispiel Merkmal Note Mathematikarbeit
Betrachtet man die Noten der letzten Mathematikarbeit, so könnte man die Klassen
- "Leistungsträger" für die Merkmalsausprägungen "sehr gut" und "gut",
- "Mittelfeld" für die Merkmalsausprägungen "befriedigend" und "ausreichend" und
- "Blauer Brief" für die Merkmalsausprägungen "mangelhaft" und "ungenügend" bilden,
um eine knappe Übersicht über die Lerngruppe zu erhalten.
Im Folgenden werden aber nur noch quantitative Merkmale betrachtet.
Nicht immer macht es Sinn, alle verschiedenen Merkmalsausprägungen einzeln zu betrachten. Bei quantitativen Merkmalen fasst man oft verschiedene Merkmalsausprägungen zu Klassen zusammen.
Beispiel Körpergröße (in cm)
Körpergröße in cm | ||||
---|---|---|---|---|
170 | 178 | 174 | 188 | 168 |
191 | 169 | 159 | 199 | 200 |
177 | 178 | 200 | 193 | 169 |
151 | 185 | 191 | 165 | 158 |
185 | 188 | 194 | 180 | 170 |
Betrachtet man zum Beispiel die Körpergröße (in cm) der Schüler und Schülerinnen der Klasse HHU5 am Berufskolleg Hattingen (Schuljahr 2012/2013):
Wenn man hier die verschiedenen Merkmalsausprägungen mit ihren absoluten und relativen Häufigkeiten erfasst, ist noch nicht wirklich etwas gewonnen, da es 18 verschiedene Merkmalsausprägungen gibt, von denen sieben die absolute Häufigkeit 2 und alle anderen die absolute Häufigkeit 1 haben. (Der geneigte Leser mag das selber nachrechnen.)
Man könnte zum Beispiel die Frage "Wie viele Schüler sind größer als 175 cm und höchstens 183 cm? stellen.
Dann ist es sinnvoll, eine absolute Häufigkeitsverteilung mit drei verschiedenen Klassen zu bilden. Jede Klasse hat eine untere und eine obere Grenze. Wichtig ist, dass sich die Klassen nicht überschneiden, damit jeder Beobachtungswert nur genau zu einer Klasse gehört.
Klasseneinteilung
Klasse :
- vom kleinsten Wert (hier: 151 cm) bis zu 175 cm einschließlich
- mathematische Kurzschreibweise:
Klasse :
- von über 175 cm bis zu 183 cm einschließlich
- mathematische Kurzschreibweise:
Klasse :
- von über 183 cm bis zum größten Wert (hier 200 cm) einschließlich
- mathematische Kurzschreibweise:
Häufigkeitsverteilung bestimmen
Jetzt kann man die absolute Häufigkeit zu jeder Klasse bestimmen, indem man alle Beobachtungswerte zählt, die im Intervall der Klasse liegen. Dann lässt sich auch die relative Häufigkeit zu jeder Klasse bestimmen, indem man den Anteil aller Beobachtungswerte am Stichprobenumfang , die im Intervall der Klasse liegen, berechnet.
Klassierte Körpergrößen HHU5 2012/2013 | ||||
---|---|---|---|---|
Summe | ||||
Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle \frac{2}{5}=40 %} | Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle \frac{4}{25}=16 %} | Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle \frac{11}{25}=44 %} | Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle 100 %} |
Interpretation
Es sind also nicht nur vier Schüler größer als 175 cm und höchstens 183 cm. Es sieht so aus, als wären die Schüler der Klasse entweder klein oder groß, weil die Klasse in der Mitte so selten vertreten ist.
Stimmt das denn?
Hier ist es hilfreich, sich mit den Klassenbreiten zu beschäftigen.
Klassenbreiten bestimmen
Die gewählten Klassen sind unterschiedlich breit. Die Breite einer Klasse errechnet man, indem man die untere Grenze von der oberen Grenze subtrahiert.
Klasse | untere Grenze | obere Grenze | Klassenbreite |
---|---|---|---|
Jetzt sieht man, dass die mittlere Klasse auch viel schmaler ist, als die beiden anderen Klassen. Die Klassenbreite hat aber Einfluss auf die Häufigkeit, mit der die Beobachtungswerte in der Klasse liegen. Deshalb wählt man in der Regel Klassen mit gleicher Klassenbreite. Nur in Ausnahmefällen machen Klassen mit unterschiedlichen Klassenbreiten Sinn. Ganz besonders gut geeignet sind unterschiedliche Klassenbreiten, wenn man schon vorher weiß, welche Aussage man mit den Daten unterstützen möchte.
Auch die obige Fragestellung hätte man prima mit gleich breiten Klassen lösen können. Dabei beginnt man dann mit dem aus der Frage vorgegebenen Intervall und bildet alle nötigen Klassen darunter und darüber mit Klassenbreite 8 cm so, dass man auch den kleinsten und den größten Beobachtungswert einer Klasse zuordnen kann.
Das sieht dann so aus:
Klassierte Körpergrößen HHU5 2012/2013 | |||
---|---|---|---|
Klasse | Intervall | ||
Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle \frac{1}{25}=4 %} | |||
Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle \frac{2}{25}=8 %} | |||
Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle \frac{1}{25}=4 %} | |||
Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle \frac{6}{25}=24 %} | |||
Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle \frac{4}{25}=16 %} | |||
Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle \frac{6}{25}=24 %} | |||
Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle \frac{3}{25}=12 %} | |||
Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle \frac{2}{25}=8 %} | |||
Summe | Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle 100%} |
Interpretation
Man kann leicht erkennen, dass es - unter Berücksichtigung der Klassenbreite - nur zwei Klassen gibt, in denen sich mehr Beobachtungswerte befinden. So erhält man also ein ganz anderes Bild der Verteilung.
Man unterscheidet zwei Arten von Klassenbildungen:
- Klassen mit gleicher Klassenbreite
- Klassen mit unterschiedlicher Klassenbreite
Übrigens eignen sich Klassen mit unterschiedlicher Klassenbreite hervorragend, um Daten so aufzubereiten, dass sie die gewünschte Aussage (hier entweder eine Klasse mit besonders großen Schülern oder mit besonders kleinen Schülern) gut unterstützen. Hier gilt der allseits beliebte Spruch: "Traue keiner Statistik, die du nicht selbst gefälscht hast."
Sie haben Ihr Regelheft mit dem sechsten Merksatz gefüllt.
Übungen
Ordnen Sie die mathematischen Bezeichnungen und Formeln richtig zu.
Klassen | haben eine obere Grenze | haben eine untere Grenze | ||
Klassenbreite | Spannweite geteilt durch Klassenanzahl | |||
Spannweite | Differenz aus größter und kleinster Merkmalsausprägung | |||
Klassenanzahl | Wurzel aus dem Stichprobenumfang | |||
größte Merkmalsausprägung | ||||
kleinste Merkmalsausprägung |
Die PurFrucht Gmbh stellt auch Orangensaft her. Ein neuer Lieferant behauptet, dass sich aus einer 250 g schweren Orange 50 ml Saft herauspressen lässt. Eine Überprüfung von gleich schweren Orangen lieferte diese Ergebnisse [ml]:
52,5; 51,7; 52,3; 50,9; 48,8; 51,4; 48,3; 52,2; 51,4; 50,7; 50,8; 52,0; 48,4; 50,0; 51,4; 49,1; 47,5; 51,5; 48,7; 51,3; 47,9; 49,5; 49,9; 50,1; 50,2; 52,4; 52,0; 50,1; 49,9; 51,9; 48,7; 51,4; 52,4; 47,9; 51,0; 48,9; 50,2; 48,0; 51,5; 49,8; 49,1; 48,4; 51,7; 51,1; 51,2; 51,5; 48,3; 51,5; 51,1
Klassieren Sie die Daten und stellen Sie die absoluten und relativen Häufigkeitsverteilung auf und geben Sie an, was in diesem Fall Merkmalsträger, Merkmal und Merkmalsausprägung ist.
Entscheiden Sie begründet, ob der Lieferant vertrauenswürdig ist.
Lernpfad Beschreibende Statistik
- Grundbegriffe
- Graphische Darstellungen von Häufigkeitsverteilungen
- Lagemaße
(arithmetisches Mittel, Modus, Median) - Streuungsmaße
(mittlere absolute Abweichung, mittlere quadratische Abweichung, Standardabweichung) - Einsatz des Taschenrechners
(Bedienung Casio fx-991DE PLUS)