Beschreibende Statistik/Lagemaße
Mithilfe von Lagemaßen wird die Vielzahl der Daten einer Häufigkeitsverteilung auf eine Kennzahl reduziert. Oft ist es gar nicht so wichtig, wie ein Häufigkeitsverteilung im Einzelnen aussieht. Man interessiert sich vielmehr für den mittleren Wert. Die Merkmalsausprägungen gruppieren sich um die Mitte. Ein Lagemaß charakterisiert die Lage einer Verteilung.
Sie lernen hier drei verschiedene Lagemaße kennen und anwenden:
- das arithmetische Mittel (auch Durchschnitt oder Mittelwert),
- den Modus (auch Modalwert) und
- den Median (auch Zentralwert).
Jedes einzelne dieser Lagemaße kann sinnvoll sein, je nachdem welche Merkmalsart vorliegt und wie die Häufigkeitsverteilung aussieht.
Info
Einwaage Marmelade
Urliste Einwaage | ||||||||||
Einwaage in g | 495 | 500 | 495 | 495 | 516 | 495 | 500 | 500 | 498 | 498 |
Die PurFrucht GmbH produziert Marmelade. Diese wird maschinell in Gläser zu je 500 g abgefüllt. Aufgrund eines Einstellungsfehlers variiert die Einwaage jedoch und eine Stichprobe von 10 Gläsern hat folgendes Ergebnis geliefert:
Wie gut arbeitet die Maschine? Wie sollten die Einstellungen angepasst werden, um ein besseres Ergebnis zu erzielen?
Arithmetisches Mittel
Das arithmetische Mittel ist die Summe aller Beobachtungswerte dividiert durch den Stichprobenumfang .
Mathematische Kurzschreibweise:
Eine ausführliche Anleitung gibt es hier.
Diese Definition des arithmetischen Mittels liefert:
Das arithmetische Mittel liegt bei 500 g.
Modus
Um den Modus zu berechnen ist es sinnvoll, die Urliste zu sortieren:
sortierte Urliste Einwaage | ||||||||||
Einwaage in g | 495 | 495 | 495 | 495 | 498 | 498 | 500 | 500 | 500 | 516 |
Jetzt lässt sich leicht ablesen:
Der Modus liegt bei 495 g.
Median
Eine ausführliche Anleitung gibt es hier.
Betrachtet man also die sortierte Urliste, so erkennt man:
sortierte Urliste Einwaage | ||||||||||
Einwaage in g | 495 | 495 | 495 | 495 | 498 | 498 | 500 | 500 | 500 | 516 |
Hier berechnet sich der Median als arithmetisches Mittel der mittleren beiden Werte:
Der Median liegt bei 498 g.
Lagemaße ermitteln
Nicht immer ist eine Urliste oder eine sortierte Urliste gegeben. Oft sind die Daten auch schon als absolute oder relative Häufigkeitsverteilung aufbereitet. Wie kommt man dann an die verschiedenen Lagemaße?
Angenommen, die Daten aus dem obigen Beispiel lägen nur als absolute Häufigkeitsverteilung vor:
absolute Häufigkeit Einwaage | |||||
Einwaage in g | 495 | 498 | 500 | 516 | Summe |
4 | 2 | 3 | 1 | 10 |
Um das arithmetische Mittel zu berechnen, nutzt man einfach eine zweite mögliche Definition:
Ist eine absolute Häufigkeitsverteilung gegeben, so berechnet man das arithmetische Mittel als
Eine ausführliche Anleitung gibt es [[../../Einsatz des Taschenrechners/ausführliche Anleitung|hier]].
Hier also:
Modus ermitteln
Der Modus ist leicht zu finden: Man liest einfach die höchste absolute Häufigkeit ab und die dazugehörende Merkmalsausprägung liefert den Modus .
absolute Häufigkeit Einwaage | |||||
Einwaage in g | 495 | 498 | 500 | 516 | Summe |
4 | 2 | 3 | 1 | 10 |
Der Modus liegt bei .
Beim Median addiert man die absoluten Häufigkeiten solange auf, bis man zur Mitte des Stichprobenumfangs gelangt ist.
Eine ausführliche Anleitung gibt es [[../../Einsatz des Taschenrechners/ausführliche Anleitung|hier]].
Im Beispiel mit sucht man also den 5. und 6. Wert:
absolute Häufigkeit Einwaage | |||||
Einwaage in g | 495 | 498 | 500 | 516 | Summe |
4 | 2 | 3 | 1 | 10 |
Die erste absolute Häufigkeit ist 4, also kleiner als 5 und 6.
Die nächste ist absolute Häufigkeit ist 2, 4+2=6, also Ziel erreicht.
Die zugehörige Merkmalsausprägung :
- .
Der Median liegt bei 498 g.
Bleibt die Frage: Und wie geht das, wenn die Daten nur als relative Häufigkeitsverteilung vorliegen?
relative Häufigkeit Einwaage | |||||
Einwaage in g | 495 | 498 | 500 | 516 | Summe |
40% | 20% | 30% | 10% | 100% |
|}
Um das arithmetische Mittel zu berechnen, nutzt man einfach die dritte mögliche Definition:
Ist eine relative Häufigkeitsverteilung gegeben, so berechnet man das arithmetische Mittel als
Hier also:
Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle \bar x=495 \cdot 40%+498 \cdot 20%+500 \cdot 30%+516 \cdot 10%=500}
Das arithmetische Mittel liegt bei 500 g. |}
Den Modus findet man, indem man die höchste relative Häufigkeit nimmt und die dazugehörende Merkmalsausprägung liefert den Modus .
relative Häufigkeit Einwaage | |||||
Einwaage in g | 495 | 498 | 500 | 516 | Summe |
40% | 20% | 30% | 10% | 100% |
| |- |colspan="7"|
Der Modus liegt bei 495 g.
|}
Median ermitteln
Beim Median addiert man die relativen Häufigkeiten bis zu 50 % auf und liest die zugehörige Merkmalsausprägung ab.
Im Beispiel:
relative Häufigkeit Einwaage | |||||
Einwaage in g | 495 | 498 | 500 | 516 | Summe |
40% | 20% | 30% | 10% | 100% |
Die erste relative Häufigkeit beträgt 40%, also kleiner als 50%.
Die nächste ist absolute Häufigkeit beträgt 20%, 40%+20%=60%, also Ziel erreicht.
Die zugehörige Merkmalsausprägung liefert den Median: .
Der Median liegt bei 498 g.
Interpretation der Ergebnisse:
- Das arithmetische Mittel - also die durchschnittliche Einwaage - liegt bei 500 g. Also haben im Mittel alle Gläser eine Einwaage von 500 g.
- Der Modus (also der am häufigsten vorkommende Wert) liegt bei 495 g. Das ist natürlich eher nicht so gut und könnte zu Kundenreklamationen führen. Aber hier ist zu bedenken, dass der Modus als Maß für die Mitte nur bei großem Stichprobenumfang wirklich aussagekräftig ist.
- Der Median liegt bei 498 g. Das ist allerdings kritisch, da somit mehr die Hälfte aller Gläser eine zu geringe Einwaage aufweisen.
Das arithmetische Mittel (auch Mittelwert oder Durchschnitt) berechnet sich bei
- gegebener Urliste als
- gegebener absoluter Häufigkeitsverteilung als
- gegebener relativer Häufigkeitsverteilung als
Das arithmetische Mittel entspricht nicht immer einer Merkmalsausprägung der Urliste.
Der Modus (auch Modalwert) ist
- bei gegebener Urliste der Beobachtungswert, der am häufigsten vorkommt.
- bei absoluter oder relativer Häufigkeitsverteilung die Merkmalsausprägung, die am häufigsten vorkommt.
Der Modus muss nicht eindeutig sein, entspricht aber in jedem Fall einer Merkmalsausprägung.
Der Median (auch Zentralwert) ist
- der Beobachtungswert in der Mitte der sortierten Urliste bei ungeradem Stichprobenumfang
- das arithmetische Mittel der mittleren Beobachtungswerte und in der Mitte der sortierten Urliste bei geradem Stichprobenumfang
- bei gegebener absoluter oder relativer Häufigkeitsverteilung durch Addition der Häufigkeiten bis zur Mitte zu ermitteln.
Das passende Lagemaß auswählen
Lagemaße berechnen ist nicht schwierig, aber welches ist das Richtige?
Diese Frage ist nicht leicht und schon gar nicht einfach zu beantworten.
Der Modus ist toll bei großen Datenmengen. Er ist unempfindlich gegenüber Ausreißern in den Beobachtungswerten und er kann auch bei qualitativen Merkmalen verwendet werden. Außerdem ist sichergestellt, dass der Modus immer auch eine Merkmalsausprägung ist.
Der Median ist auch unempfindlich gegenüber Ausreißern in den Beobachtungswerten. Aber um mit dem Median arbeiten zu können, müssen qualitative Merkmale eine Ordinalskala haben, für qualitative Merkmale mit Nominalskala bleibt nur der Modus. Es kann allerdings passieren, dass der Median einen Wert annimmt, der als Merkmalsausprägung nicht vorkommt.
Das arithmetische Mittel lässt sich nur bei qualitativen Merkmalen anwenden. Leider reagiert das arithmetische Mittel aber sehr empfindlich auf Ausreißer und ist dann wenig aussagekräftig. Auch bei dem arithmetischen Mittel ist es möglich, dass ein Wert ermittelt wird, der als Merkmalsausprägung nicht vorkommt.
Es ist also in jedem einzelnen Fall zu prüfen, welches Lagemaß für das bestimmte Merkmal mit der gegebenen Häufigkeitsverteilung am besten geeignet ist.
Übungen
Ordnen Sie die mathematischen Bezeichnungen und Formeln richtig zu.
arithmetisches Mittel | Durchschnitt | Mittelwert | |
Median | Zentralwert | der mittlere Wert eines sortierten Urliste | |
Modus | der häufigste Wert | Modalwert |
Ordnen Sie die mathematischen Bezeichnungen und Formeln richtig zu, wenn die Daten als ... vorliegen.
Urliste | |||
absolute Häufigkeitsverteilung | |||
relative Häufigkeitsverteilung |
Gegeben sind die folgenden Urlisten:
- 5; 7; 8; 7; 10; 10; 7; 6
- 5; 7; 8; 7; 10; 10; 7; 6; 48
- 5; 7; 8; 7; 10; 10; 7; 6; 48; 2
Bestimmen Sie Modus, Median und arithmetisches Mittel für jede der drei Listen.
Die erste Liste sortieren, Stichprobenumfang
- 5; 6; 7; 7; 7; 8; 10; 10
Modus Median arithmetisches Mittel
Da alle drei Lagemaße nah beieinander liegen, kann man davon ausgehen, dass es hier keine Ausreißer gibt und man jedes als Maß für die Mitte der Verteilung nutzen kann.
Die zweite Liste sortieren, Stichprobenumfang
- 5; 6; 7; 7; 7; 8; 10; 10; 48
Modus Median arithmetisches Mittel
Bemerkung: Hier sieht man den Einfluß, den der neu dazugekommene Ausreißer 48 auf das arithmetische Mittel hat. Es ist das Einzige der drei Lagemaße, dass auf den neuen Wert reagiert. Hier ist das arithmetische Mittel nicht geeignet, die Mitte der Verteilung zu beschreiben.
Die dritte Liste sortieren, Stichprobenumfang
- 2; 5; 6; 7; 7; 7; 8; 10; 10; 48
Modus Median arithmetisches Mittel
Bemerkung: Auch hier sieht man den Einfluß, den der neu dazugekommene zweite Ausreißer 2 auf das arithmetische Mittel hat. Es ist wieder das Einzige der drei Lagemaße, dass auf den neuen Wert reagiert. Hier ist das arithmetische Mittel nicht geeignet, die Mitte der Verteilung zu beschreiben.
Die Firma Schmidt&Müller GmbH produziert unter anderem Schrauben mit einer Solllänge von 60 mm. In der Qualitätskontrolle werden der laufenden Produktion 20 Schrauben entnommen und die Beobachtungswerte (in mm) notiert:
59,5; 60,5; 60,0; 59,5; 59,5; 61,9; 59,5; 59,8; 60,3; 60,9; 61,5; 61,0; 60,2; 61,2; 60,3; 58,9; 60,8; 59,5; 58,5; 59,2
- Bestimmen Sie das arithmetische Mittel und den Median der Verteilung.
- Vergleichen Sie die beiden Lagemaße.
- Bei der 21. Entnahme wird eine besonders kurze Schraube von 57,0 mm entnommen. Wie beeinflusst diese Schraube arithmetisches Mittel und Median der Verteilung?
Am einfachsten findet man die Lösung durch Einsatz eines Tabellenkalkulationsprogramms.
Die ersten 20 Beobachtungswerte liefern: Median mm arithmetisches Mittel mm.
Sowohl der Durchschnitt als auch das Zentrum der Verteilung liegen über dem Sollwert von 60 mm. Der Median ist mit 60,1 mm weiter vom Sollwert entfernt als das arithmetische Mittel von 60,08 mm.
Die ersten 21 Beobachtungswerte liefern: Median mm arithmetisches Mittel
Beide Werte verändern sich nach unten. Der Durchschnitt liegt jetzt unter der Solllänge von 60 mm, das Zentrum der Verteilung liegt genau bei 60 mm.
Die Schülerinnen und Schüler des bkh nehmen an einer Befragung teil, in der die Ausstattung und Optik der Schule bewertet werden soll.
Bestimmen Sie jeweils
- das arithmetische Mittel,
- den Median (Zentralwert) und
- den Modus (Modalwert) der Ergebnisse.
Entscheiden Sie begründet, welches Lagemaß die höchste Aussagekraft hat.
a)
Bewertung der Ausstattung und Optik | Anzahl der Schüler |
1 (sehr gut) | 43 |
2 (gut) | 22 |
3 (befriedigend) | 15 |
4 (ausreichend) | 36 |
5 (mangelhaft) | 21 |
6 (ungenügend) | 24 |
b)
Bewertung der Ausstattung und Optik | Anzahl der Schüler |
1 (sehr gut) | 25 |
2 (gut) | 29 |
3 (befriedigend) | 28 |
4 (ausreichend) | 27 |
5 (mangelhaft) | 28 |
6 (ungenügend) | 24 |
Stichprobenumfang
a) Modus (sehr gut) (der häufigste Wert) Median durch summieren der Häufigkeiten bis 81, zugehörige Merkmalsausprägung ablesen (ausreichend) (das Zentrum der Verteilung) Arithmetisches Mittel (der Mittelwert oder Durchschnitt der Verteilung)
b) Modus (gut) (der häufigste Wert) Median durch summieren der Häufigkeiten bis 81, zugehörige Merkmalsausprägung ablesen (befriedigend) (das Zentrum der Verteilung) Arithmetisches Mittel (der Mittelwert oder Durchschnitt der Verteilung)
Der Modus ist nicht so aussagekräftig wie der Median, da der Stichprobenumfang nicht besonders groß ist.
Das arithmetische Mittel kann zwar berechnet werden, aber es kommt selbst als Merkmalsausprägung nicht vor. Hier verhält es sich so ähnlich wie der Durchschnitt aller Noten in einer Klassenarbeit. Das Merkmal ist qualitativ mit Ordinalskala.
Aufgabe 6
Lernpfad Beschreibende Statistik
- Grundbegriffe
- Graphische Darstellungen von Häufigkeitsverteilungen
- Lagemaße
(arithmetisches Mittel, Modus, Median) - Streuungsmaße
(mittlere absolute Abweichung, mittlere quadratische Abweichung, Standardabweichung) - Einsatz des Taschenrechners
(Bedienung Casio fx-991DE PLUS)
Lernziele
Sie kennen die Begriffe
- Grundgesamtheit, Stichprobe, Stichprobenumfang,
- Merkmal, Merkmalsausprägung, Beobachtungswert, Urliste, Merkmalsträger,
- arithmetisches Mittel, Modus, Median,
- absolute und relative Häufigkeitsverteilung,
- Klassen, Klassenanzahl, Spannweite und Klassenbreite.
Sie können
- diesen Begriffen die mathematischen Bezeichnungen zuordnen und
- sie im Sachkontext richtig anwenden.
Sie können zu gegebenen Daten
- eine passende graphische Darstellung auswählen und
- die Daten graphisch aussagekräftig aufbereiten.
Sollten Sie unsicher sein, so finden Sie alle nötigen Informationen hier:
Grundbegriffe der beschreibenden Statistik
Lernpfad Beschreibende Statistik
- Grundbegriffe
- Graphische Darstellungen von Häufigkeitsverteilungen
- Lagemaße
(arithmetisches Mittel, Modus, Median) - Streuungsmaße
(mittlere absolute Abweichung, mittlere quadratische Abweichung, Standardabweichung) - Einsatz des Taschenrechners
(Bedienung Casio fx-991DE PLUS)