Beschreibende Statistik/Lagemaße: Unterschied zwischen den Versionen

Aus ZUM-Unterrichten
(Formel Darstellung geändert)
Markierung: 2017-Quelltext-Bearbeitung
(Bearbeitung rückgängig gemacht)
 
Zeile 34: Zeile 34:


Mathematische Kurzschreibweise:
Mathematische Kurzschreibweise:
:: <math forcemathmode="png">\bar x=\frac{1}{n}(a_1+a_2+ \cdots +a_{n-1}+a_n)=\frac{1}{n}\sum_{i=1}^n a_i</math>
:: <math>\bar x=\frac{1}{n}(a_1+a_2+ \cdots +a_{n-1}+a_n)=\frac{1}{n}\sum_{i=1}^n a_i</math>
}}
}}
<!-- Ende Definition Arithmetisches Mittel -->
<!-- Ende Definition Arithmetisches Mittel -->

Aktuelle Version vom 16. Oktober 2022, 12:44 Uhr

Mithilfe von Lagemaßen wird die Vielzahl der Daten einer Häufigkeitsverteilung auf eine Kennzahl reduziert. Oft ist es gar nicht so wichtig, wie ein Häufigkeitsverteilung im Einzelnen aussieht. Man interessiert sich vielmehr für den mittleren Wert. Die Merkmalsausprägungen gruppieren sich um die Mitte. Ein Lagemaß charakterisiert die Lage einer Verteilung.

Sie lernen hier drei verschiedene Lagemaße kennen und anwenden:

  • das arithmetische Mittel (auch Durchschnitt oder Mittelwert),
  • den Modus (auch Modalwert) und
  • den Median (auch Zentralwert).

Jedes einzelne dieser Lagemaße kann sinnvoll sein, je nachdem welche Merkmalsart vorliegt und wie die Häufigkeitsverteilung aussieht.

Info

Einwaage Marmelade

Urliste Einwaage
Einwaage in g 495 500 495 495 516 495 500 500 498 498

Die PurFrucht GmbH produziert Marmelade. Diese wird maschinell in Gläser zu je 500 g abgefüllt. Aufgrund eines Einstellungsfehlers variiert die Einwaage jedoch und eine Stichprobe von 10 Gläsern hat folgendes Ergebnis geliefert:

Wie gut arbeitet die Maschine? Wie sollten die Einstellungen angepasst werden, um ein besseres Ergebnis zu erzielen?

Aufgabe
Welche Information liefern die drei Lagemaße bezogen auf das obige Beispiel?

Arithmetisches Mittel

Definition

Das arithmetische Mittel ist die Summe aller Beobachtungswerte dividiert durch den Stichprobenumfang .

Mathematische Kurzschreibweise:




Aufgabe
Man kann die Urliste direkt in den Taschenrechner eingeben und das arithmetische Mittel dann bequem berechnen lassen.

Eine ausführliche Anleitung gibt es hier.


Diese Definition des arithmetischen Mittels liefert:

Das arithmetische Mittel liegt bei 500 g.

Modus

Definition
Der Modus ist der Beobachtungswert, der am häufigsten vorkommt. Es ist also derjenige Wert, der die größte Häufigkeit aufweist.




Um den Modus zu berechnen ist es sinnvoll, die Urliste zu sortieren:

sortierte Urliste Einwaage
Einwaage in g 495 495 495 495 498 498 500 500 500 516

Jetzt lässt sich leicht ablesen:

Der Modus liegt bei 495 g.

Median

Definition
Der Median ist der Wert, der in der Mitte steht, wenn alle Beobachtungswerte der Größe nach geordnet sind. Bei gerader Anzahl von Beobachtungswerten ist der Median das arithmetische Mittel der beiden mittleren Werte.




Aufgabe
Man kann die Urliste direkt in den Taschenrechner eingeben und den Median dann bequem berechnen lassen.

Eine ausführliche Anleitung gibt es hier.

Betrachtet man also die sortierte Urliste, so erkennt man:

sortierte Urliste Einwaage
Einwaage in g 495 495 495 495 498 498 500 500 500 516

Hier berechnet sich der Median als arithmetisches Mittel der mittleren beiden Werte:

Der Median liegt bei 498 g.

Lagemaße ermitteln

Nicht immer ist eine Urliste oder eine sortierte Urliste gegeben. Oft sind die Daten auch schon als absolute oder relative Häufigkeitsverteilung aufbereitet. Wie kommt man dann an die verschiedenen Lagemaße?

Angenommen, die Daten aus dem obigen Beispiel lägen nur als absolute Häufigkeitsverteilung vor:

absolute Häufigkeit Einwaage
Einwaage in g 495 498 500 516 Summe
4 2 3 1 10

Um das arithmetische Mittel zu berechnen, nutzt man einfach eine zweite mögliche Definition:

Definition

Ist eine absolute Häufigkeitsverteilung gegeben, so berechnet man das arithmetische Mittel als

wobei die Anzahl der Merkmalsausprägungen angibt.




Einsatz des Taschenrechners
Man kann die Häufigkeitsverteilung direkt in den Taschenrechner eingeben und das arithmetische Mittel dann bequem berechnen lassen.

Eine ausführliche Anleitung gibt es [[../../Einsatz des Taschenrechners/ausführliche Anleitung|hier]].

Hier also:

Modus ermitteln

Der Modus ist leicht zu finden: Man liest einfach die höchste absolute Häufigkeit ab und die dazugehörende Merkmalsausprägung liefert den Modus .

absolute Häufigkeit Einwaage
Einwaage in g 495 498 500 516 Summe
4 2 3 1 10

Der Modus liegt bei .


Beim Median addiert man die absoluten Häufigkeiten solange auf, bis man zur Mitte des Stichprobenumfangs gelangt ist.


Einsatz des Taschenrechners
Man kann die Häufigkeitsverteilung direkt in den Taschenrechner eingeben und den Median dann bequem berechnen lassen.

Eine ausführliche Anleitung gibt es [[../../Einsatz des Taschenrechners/ausführliche Anleitung|hier]].


Im Beispiel mit sucht man also den 5. und 6. Wert:

absolute Häufigkeit Einwaage
Einwaage in g 495 498 500 516 Summe
4 2 3 1 10

Die erste absolute Häufigkeit ist 4, also kleiner als 5 und 6.

Die nächste ist absolute Häufigkeit ist 2, 4+2=6, also Ziel erreicht.

Die zugehörige Merkmalsausprägung :

.

Der Median liegt bei 498 g.


Bleibt die Frage: Und wie geht das, wenn die Daten nur als relative Häufigkeitsverteilung vorliegen?

relative Häufigkeit Einwaage
Einwaage in g 495 498 500 516 Summe
40% 20% 30% 10% 100%

|}

Um das arithmetische Mittel zu berechnen, nutzt man einfach die dritte mögliche Definition:

Definition

Ist eine relative Häufigkeitsverteilung gegeben, so berechnet man das arithmetische Mittel als

wobei die Anzahl der Merkmalsausprägungen angibt.




Hier also: Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle \bar x=495 \cdot 40%+498 \cdot 20%+500 \cdot 30%+516 \cdot 10%=500}

Das arithmetische Mittel liegt bei 500 g. |}

Den Modus findet man, indem man die höchste relative Häufigkeit nimmt und die dazugehörende Merkmalsausprägung liefert den Modus .

relative Häufigkeit Einwaage
Einwaage in g 495 498 500 516 Summe
40% 20% 30% 10% 100%

| |- |colspan="7"|


Der Modus liegt bei 495 g. |}

Median ermitteln

Beim Median addiert man die relativen Häufigkeiten bis zu 50 % auf und liest die zugehörige Merkmalsausprägung ab.

Im Beispiel:

relative Häufigkeit Einwaage
Einwaage in g 495 498 500 516 Summe
40% 20% 30% 10% 100%

Die erste relative Häufigkeit beträgt 40%, also kleiner als 50%.

Die nächste ist absolute Häufigkeit beträgt 20%, 40%+20%=60%, also Ziel erreicht.

Die zugehörige Merkmalsausprägung liefert den Median: .


Der Median liegt bei 498 g.

Interpretation der Ergebnisse:

  • Das arithmetische Mittel - also die durchschnittliche Einwaage - liegt bei 500 g. Also haben im Mittel alle Gläser eine Einwaage von 500 g.
  • Der Modus (also der am häufigsten vorkommende Wert) liegt bei 495 g. Das ist natürlich eher nicht so gut und könnte zu Kundenreklamationen führen. Aber hier ist zu bedenken, dass der Modus als Maß für die Mitte nur bei großem Stichprobenumfang wirklich aussagekräftig ist.
  • Der Median liegt bei 498 g. Das ist allerdings kritisch, da somit mehr die Hälfte aller Gläser eine zu geringe Einwaage aufweisen.
Merke

Das arithmetische Mittel (auch Mittelwert oder Durchschnitt) berechnet sich bei

gegebener Urliste als
gegebener absoluter Häufigkeitsverteilung als
gegebener relativer Häufigkeitsverteilung als

Das arithmetische Mittel entspricht nicht immer einer Merkmalsausprägung der Urliste.

Der Modus (auch Modalwert) ist

bei gegebener Urliste der Beobachtungswert, der am häufigsten vorkommt.
bei absoluter oder relativer Häufigkeitsverteilung die Merkmalsausprägung, die am häufigsten vorkommt.

Der Modus muss nicht eindeutig sein, entspricht aber in jedem Fall einer Merkmalsausprägung.

Der Median (auch Zentralwert) ist

der Beobachtungswert in der Mitte der sortierten Urliste bei ungeradem Stichprobenumfang
das arithmetische Mittel der mittleren Beobachtungswerte und in der Mitte der sortierten Urliste bei geradem Stichprobenumfang
bei gegebener absoluter oder relativer Häufigkeitsverteilung durch Addition der Häufigkeiten bis zur Mitte zu ermitteln.
Der Median entspricht nicht in jedem Fall einer Merkmalsausprägung.

Das passende Lagemaß auswählen

Lagemaße berechnen ist nicht schwierig, aber welches ist das Richtige?

Diese Frage ist nicht leicht und schon gar nicht einfach zu beantworten.

Der Modus ist toll bei großen Datenmengen. Er ist unempfindlich gegenüber Ausreißern in den Beobachtungswerten und er kann auch bei qualitativen Merkmalen verwendet werden. Außerdem ist sichergestellt, dass der Modus immer auch eine Merkmalsausprägung ist.

Der Median ist auch unempfindlich gegenüber Ausreißern in den Beobachtungswerten. Aber um mit dem Median arbeiten zu können, müssen qualitative Merkmale eine Ordinalskala haben, für qualitative Merkmale mit Nominalskala bleibt nur der Modus. Es kann allerdings passieren, dass der Median einen Wert annimmt, der als Merkmalsausprägung nicht vorkommt.

Das arithmetische Mittel lässt sich nur bei qualitativen Merkmalen anwenden. Leider reagiert das arithmetische Mittel aber sehr empfindlich auf Ausreißer und ist dann wenig aussagekräftig. Auch bei dem arithmetischen Mittel ist es möglich, dass ein Wert ermittelt wird, der als Merkmalsausprägung nicht vorkommt.

Es ist also in jedem einzelnen Fall zu prüfen, welches Lagemaß für das bestimmte Merkmal mit der gegebenen Häufigkeitsverteilung am besten geeignet ist.


Übungen

Ordnen Sie die mathematischen Bezeichnungen und Formeln richtig zu.

arithmetisches Mittel Durchschnitt Mittelwert
Median Zentralwert der mittlere Wert eines sortierten Urliste
Modus der häufigste Wert Modalwert


Ordnen Sie die mathematischen Bezeichnungen und Formeln richtig zu, wenn die Daten als ... vorliegen.

Urliste
absolute Häufigkeitsverteilung
relative Häufigkeitsverteilung


Aufgabe

Gegeben sind die folgenden Urlisten:

  1. 5; 7; 8; 7; 10; 10; 7; 6
  2. 5; 7; 8; 7; 10; 10; 7; 6; 48
  3. 5; 7; 8; 7; 10; 10; 7; 6; 48; 2

Bestimmen Sie Modus, Median und arithmetisches Mittel für jede der drei Listen.

Die erste Liste sortieren, Stichprobenumfang

5; 6; 7; 7; 7; 8; 10; 10

Modus Median arithmetisches Mittel

Da alle drei Lagemaße nah beieinander liegen, kann man davon ausgehen, dass es hier keine Ausreißer gibt und man jedes als Maß für die Mitte der Verteilung nutzen kann.

Die zweite Liste sortieren, Stichprobenumfang

5; 6; 7; 7; 7; 8; 10; 10; 48

Modus Median arithmetisches Mittel

Bemerkung: Hier sieht man den Einfluß, den der neu dazugekommene Ausreißer 48 auf das arithmetische Mittel hat. Es ist das Einzige der drei Lagemaße, dass auf den neuen Wert reagiert. Hier ist das arithmetische Mittel nicht geeignet, die Mitte der Verteilung zu beschreiben.

Die dritte Liste sortieren, Stichprobenumfang

2; 5; 6; 7; 7; 7; 8; 10; 10; 48

Modus Median arithmetisches Mittel

Bemerkung: Auch hier sieht man den Einfluß, den der neu dazugekommene zweite Ausreißer 2 auf das arithmetische Mittel hat. Es ist wieder das Einzige der drei Lagemaße, dass auf den neuen Wert reagiert. Hier ist das arithmetische Mittel nicht geeignet, die Mitte der Verteilung zu beschreiben.

Aufgabe
Entscheiden Sie.

1 Das arithmetische Mittel ist die Summe aller Werte.

Ja, das stimmt.
Nein, das stimmt nicht.

2 Eine Hälfte aller Werte ist immer größer als der Modus.

Nein, das stimmt nicht.
Ja, das stimmt.

3 Das arithmetische Mittel ist der Quotient aus der Summe aller Werte und der Anzahl aller Werte.

Nein, das stimmt nicht.
Ja, das stimmt.

4 Das arithmetische Mittel ist der Quotient aus dem Produkt aller Werte und der Anzahl aller Werte.

Nein, das stimmt nicht.
Ja, das stimmt.

5 Der Median und das arithmetische Mittel sind identisch.

Nein, das stimmt nicht.
Ja, das stimmt.

6 Der Zentralwert und der Median sind identisch.

Nein, das stimmt nicht.
Ja, das stimmt.

7 Der Zentralwert und der Modus sind identisch.

Nein, das stimmt nicht.
Ja, das stimmt.

8 Die Hälfte aller Werte ist kleiner oder genauso groß wie der Median.

Nein, das stimmt nicht.
Ja, das stimmt.

9 Der Modus ist nur für quantitative Merkmale geeignet.

Nein, das stimmt nicht.
Ja, das stimmt.

10 Das arithmetische Mittel ist nur für quantitative Merkmale geeignet.

Nein, das stimmt nicht.
Ja, das stimmt.


Aufgabe

Die Firma Schmidt&Müller GmbH produziert unter anderem Schrauben mit einer Solllänge von 60 mm. In der Qualitätskontrolle werden der laufenden Produktion 20 Schrauben entnommen und die Beobachtungswerte (in mm) notiert:

59,5; 60,5; 60,0; 59,5; 59,5; 61,9; 59,5; 59,8; 60,3; 60,9; 61,5; 61,0; 60,2; 61,2; 60,3; 58,9; 60,8; 59,5; 58,5; 59,2

  • Bestimmen Sie das arithmetische Mittel und den Median der Verteilung.
  • Vergleichen Sie die beiden Lagemaße.
  • Bei der 21. Entnahme wird eine besonders kurze Schraube von 57,0 mm entnommen. Wie beeinflusst diese Schraube arithmetisches Mittel und Median der Verteilung?

Am einfachsten findet man die Lösung durch Einsatz eines Tabellenkalkulationsprogramms.

Die ersten 20 Beobachtungswerte liefern: Median mm arithmetisches Mittel mm.

Sowohl der Durchschnitt als auch das Zentrum der Verteilung liegen über dem Sollwert von 60 mm. Der Median ist mit 60,1 mm weiter vom Sollwert entfernt als das arithmetische Mittel von 60,08 mm.

Die ersten 21 Beobachtungswerte liefern: Median mm arithmetisches Mittel

Beide Werte verändern sich nach unten. Der Durchschnitt liegt jetzt unter der Solllänge von 60 mm, das Zentrum der Verteilung liegt genau bei 60 mm.

Aufgabe

Die Schülerinnen und Schüler des bkh nehmen an einer Befragung teil, in der die Ausstattung und Optik der Schule bewertet werden soll.

Bestimmen Sie jeweils

  • das arithmetische Mittel,
  • den Median (Zentralwert) und
  • den Modus (Modalwert) der Ergebnisse.

Entscheiden Sie begründet, welches Lagemaß die höchste Aussagekraft hat.

a)

Bewertung der Ausstattung und Optik Anzahl der Schüler
1 (sehr gut) 43
2 (gut) 22
3 (befriedigend) 15
4 (ausreichend) 36
5 (mangelhaft) 21
6 (ungenügend) 24

b)

Bewertung der Ausstattung und Optik Anzahl der Schüler
1 (sehr gut) 25
2 (gut) 29
3 (befriedigend) 28
4 (ausreichend) 27
5 (mangelhaft) 28
6 (ungenügend) 24

Stichprobenumfang

a) Modus (sehr gut) (der häufigste Wert) Median durch summieren der Häufigkeiten bis 81, zugehörige Merkmalsausprägung ablesen (ausreichend) (das Zentrum der Verteilung) Arithmetisches Mittel (der Mittelwert oder Durchschnitt der Verteilung)

b) Modus (gut) (der häufigste Wert) Median durch summieren der Häufigkeiten bis 81, zugehörige Merkmalsausprägung ablesen (befriedigend) (das Zentrum der Verteilung) Arithmetisches Mittel (der Mittelwert oder Durchschnitt der Verteilung)

Der Modus ist nicht so aussagekräftig wie der Median, da der Stichprobenumfang nicht besonders groß ist.

Das arithmetische Mittel kann zwar berechnet werden, aber es kommt selbst als Merkmalsausprägung nicht vor. Hier verhält es sich so ähnlich wie der Durchschnitt aller Noten in einer Klassenarbeit. Das Merkmal ist qualitativ mit Ordinalskala.

Aufgabe 6




Estatística ícone.svg

Lernpfad Beschreibende Statistik

  1. Grundbegriffe
  2. Graphische Darstellungen von Häufigkeitsverteilungen
  3. Lagemaße
    (arithmetisches Mittel, Modus, Median)
  4. Streuungsmaße
    (mittlere absolute Abweichung, mittlere quadratische Abweichung, Standardabweichung)
  5. Einsatz des Taschenrechners
    (Bedienung Casio fx-991DE PLUS)


Lernziele

Sie kennen die Begriffe

  • Grundgesamtheit, Stichprobe, Stichprobenumfang,
  • Merkmal, Merkmalsausprägung, Beobachtungswert, Urliste, Merkmalsträger,
  • arithmetisches Mittel, Modus, Median,
  • absolute und relative Häufigkeitsverteilung,
  • Klassen, Klassenanzahl, Spannweite und Klassenbreite.

Sie können

  • diesen Begriffen die mathematischen Bezeichnungen zuordnen und
  • sie im Sachkontext richtig anwenden.

Sie können zu gegebenen Daten

  • eine passende graphische Darstellung auswählen und
  • die Daten graphisch aussagekräftig aufbereiten.

Sollten Sie unsicher sein, so finden Sie alle nötigen Informationen hier:

Grundbegriffe der beschreibenden Statistik



Estatística ícone.svg

Lernpfad Beschreibende Statistik

  1. Grundbegriffe
  2. Graphische Darstellungen von Häufigkeitsverteilungen
  3. Lagemaße
    (arithmetisches Mittel, Modus, Median)
  4. Streuungsmaße
    (mittlere absolute Abweichung, mittlere quadratische Abweichung, Standardabweichung)
  5. Einsatz des Taschenrechners
    (Bedienung Casio fx-991DE PLUS)