Beschreibende Statistik/Lagemaße: Unterschied zwischen den Versionen
main>Matthias Scharwies Keine Bearbeitungszusammenfassung |
(Bearbeitung rückgängig gemacht) |
||
(15 dazwischenliegende Versionen von 3 Benutzern werden nicht angezeigt) | |||
Zeile 1: | Zeile 1: | ||
Mithilfe von Lagemaßen wird die Vielzahl der Daten einer Häufigkeitsverteilung auf eine Kennzahl reduziert. Oft ist es gar nicht so wichtig, wie ein Häufigkeitsverteilung im Einzelnen aussieht. Man interessiert sich vielmehr für den mittleren Wert. Die Merkmalsausprägungen gruppieren sich um die Mitte. Ein Lagemaß charakterisiert die Lage einer Verteilung. | Mithilfe von Lagemaßen wird die Vielzahl der Daten einer Häufigkeitsverteilung auf eine Kennzahl reduziert. Oft ist es gar nicht so wichtig, wie ein Häufigkeitsverteilung im Einzelnen aussieht. Man interessiert sich vielmehr für den mittleren Wert. Die Merkmalsausprägungen gruppieren sich um die Mitte. Ein Lagemaß charakterisiert die Lage einer Verteilung. | ||
Sie lernen hier drei verschiedene '''Lagemaße''' kennen und anwenden: | Sie lernen hier drei verschiedene '''Lagemaße''' kennen und anwenden: | ||
*das arithmetische Mittel (auch Durchschnitt oder Mittelwert), | |||
*den Modus (auch Modalwert) und | |||
*den Median (auch Zentralwert). | |||
Jedes einzelne dieser Lagemaße kann sinnvoll sein, je nachdem welche Merkmalsart vorliegt und wie die Häufigkeitsverteilung aussieht. | |||
==Info== | |||
===Einwaage Marmelade=== | |||
<!-- Tabelle Einwaage --> | <!-- Tabelle Einwaage --> | ||
<div style="float: | <div style="float:right; margin-left:1em;"> | ||
{| class="wikitable" | {| class="wikitable" | ||
|- | |- | ||
| colspan="11" | '''Urliste Einwaage''' | | colspan="11" |'''Urliste Einwaage''' | ||
|- | |- | ||
| Einwaage in g || 495 || 500 || 495 || 495 || 516 || 495 || 500 || 500 || 498 || 498 | |Einwaage in g||495||500||495||495||516||495||500||500||498||498 | ||
|} | |} | ||
<div> | <div> | ||
<!-- Ende Einwaage --> | <!-- Ende Einwaage --> | ||
Die PurFrucht GmbH produziert Marmelade. Diese wird maschinell in Gläser zu je 500 g abgefüllt. Aufgrund eines Einstellungsfehlers variiert die Einwaage jedoch und eine Stichprobe von 10 Gläsern hat folgendes Ergebnis geliefert: | |||
Wie gut arbeitet die Maschine? Wie sollten die Einstellungen angepasst werden, um ein besseres Ergebnis zu erzielen? | Wie gut arbeitet die Maschine? Wie sollten die Einstellungen angepasst werden, um ein besseres Ergebnis zu erzielen? | ||
Welche Information liefern die drei Lagemaße bezogen auf das obige Beispiel? | {{Aufgabe|Welche Information liefern die drei Lagemaße bezogen auf das obige Beispiel?}} | ||
===Arithmetisches Mittel=== | |||
{{Definition|1= | {{Definition|1= | ||
Das '''arithmetische Mittel''' <math>\bar x</math> ist die Summe aller Beobachtungswerte <math>a_i</math> dividiert durch den Stichprobenumfang <math>n</math>. | Das '''arithmetische Mittel''' <math>\bar{x}</math> ist die Summe aller Beobachtungswerte <math>a_i</math> dividiert durch den Stichprobenumfang <math>n</math>. | ||
Mathematische Kurzschreibweise: | Mathematische Kurzschreibweise: | ||
Zeile 43: | Zeile 37: | ||
}} | }} | ||
<!-- Ende Definition Arithmetisches Mittel --> | <!-- Ende Definition Arithmetisches Mittel --> | ||
{{Box|1=Aufgabe|2=Man kann die Urliste direkt in den Taschenrechner eingeben und das arithmetische Mittel dann bequem berechnen lassen.|3=Üben}} | |||
Eine ausführliche Anleitung gibt es [[Beschreibende Statistik/Einsatz des Taschenrechners/ausführliche Anleitung|hier]]. | |||
Diese Definition des arithmetischen Mittels liefert: | |||
::<math>\bar x=\frac{1}{10}(495+500+495+495+516+495+500+500+498+498)=\frac{1}{10}\cdot 5000=500</math> | |||
:: <math>\bar x=\frac{1}{10}(495+500+495+495+516+495+500+500+498+498)=\frac{1}{10}\cdot 5000=500</math> | |||
Das arithmetische Mittel liegt bei 500 g. | Das arithmetische Mittel liegt bei 500 g. | ||
===Modus=== | |||
{{Definition|1= | {{Definition|1= | ||
Der '''Modus''' <math>x_{Mod}</math> ist der Beobachtungswert, der am häufigsten vorkommt. Es ist also derjenige Wert, der die größte Häufigkeit aufweist. | Der '''Modus''' <math>x_{Mod}</math> ist der Beobachtungswert, der am häufigsten vorkommt. Es ist also derjenige Wert, der die größte Häufigkeit aufweist. | ||
}} | }} | ||
Um den Modus zu berechnen ist es sinnvoll, die Urliste zu sortieren: | Um den Modus zu berechnen ist es sinnvoll, die Urliste zu sortieren: | ||
<!-- Tabelle Einwaage sortiert Modus --> | <!-- Tabelle Einwaage sortiert Modus --> | ||
<div style="float: | <div style="float:right; margin-left:1em;"> | ||
{| class="wikitable" | {| class="wikitable" | ||
|- | |- | ||
| colspan="11" | '''sortierte Urliste Einwaage''' | | colspan="11" |'''sortierte Urliste Einwaage''' | ||
|- | |- | ||
| Einwaage in g || <span style="background:yellow">495</span> || <span style="background:yellow">495</span> || <span style="background:yellow">495</span> || <span style="background:yellow">495</span> || 498 || 498 || 500 || 500 || 500 || 516 | |Einwaage in g||<span style="background:yellow">495</span>||<span style="background:yellow">495</span>||<span style="background:yellow">495</span>||<span style="background:yellow">495</span>||498||498||500||500||500||516 | ||
|} | |} | ||
<div> | <div> | ||
Jetzt lässt sich leicht ablesen: <math>x_{Mod}=495</math> | |||
Der Modus liegt bei 495 g. | Der Modus liegt bei 495 g. | ||
===Median=== | |||
{{Definition|1= | {{Definition|1= | ||
Der '''Median''' <math>x_{Med}</math> ist der Wert, der in der Mitte steht, wenn alle Beobachtungswerte <math>a_i</math> der Größe nach geordnet sind. Bei gerader Anzahl von Beobachtungswerten ist der Median das arithmetische Mittel der beiden mittleren Werte. | Der '''Median''' <math>x_{Med}</math> ist der Wert, der in der Mitte steht, wenn alle Beobachtungswerte <math>a_i</math> der Größe nach geordnet sind. Bei gerader Anzahl von Beobachtungswerten ist der Median das arithmetische Mittel der beiden mittleren Werte. | ||
}} | }} | ||
{{Box|1=Aufgabe|2=Man kann die Urliste direkt in den Taschenrechner eingeben und den Median dann bequem berechnen lassen.|3=Üben}} | |||
Eine ausführliche Anleitung gibt es [[Beschreibende Statistik/Einsatz des Taschenrechners/ausführliche Anleitung|hier]]. | |||
Betrachtet man also die sortierte Urliste, so erkennt man: | Betrachtet man also die sortierte Urliste, so erkennt man: | ||
Zeile 120: | Zeile 83: | ||
{| class="wikitable" | {| class="wikitable" | ||
|- | |- | ||
| colspan="11" | '''sortierte Urliste Einwaage''' | | colspan="11" |'''sortierte Urliste Einwaage''' | ||
|- | |- | ||
| Einwaage in g || 495 || 495 || 495 || 495 || <span style="background:yellow">498</span> || <span style="background:yellow">498</span> || 500 || 500 || 500 || 516 | |Einwaage in g||495||495||495||495||<span style="background:yellow">498</span>||<span style="background:yellow">498</span>||500||500||500||516 | ||
|} | |} | ||
<div> | <div> | ||
<!-- Ende Einwaage sortiert Median --> | <!-- Ende Einwaage sortiert Median --> | ||
Hier berechnet sich der Median als arithmetisches Mittel der mittleren beiden Werte: | |||
:: <math>x_{Med}=\frac{1}{2}(498+498)=498</math> | |||
::<math>x_{Med}=\frac{1}{2}(498+498)=498</math> | |||
Der Median liegt bei 498 g. | Der Median liegt bei 498 g. | ||
==Lagemaße ermitteln== | |||
Nicht immer ist eine Urliste oder eine sortierte Urliste gegeben. Oft sind die Daten auch schon als absolute oder relative Häufigkeitsverteilung aufbereitet. Wie kommt man dann an die verschiedenen Lagemaße? | Nicht immer ist eine Urliste oder eine sortierte Urliste gegeben. Oft sind die Daten auch schon als absolute oder relative Häufigkeitsverteilung aufbereitet. Wie kommt man dann an die verschiedenen Lagemaße? | ||
Angenommen, die Daten aus dem obigen Beispiel lägen nur als absolute Häufigkeitsverteilung vor: | Angenommen, die Daten aus dem obigen Beispiel lägen nur als absolute Häufigkeitsverteilung vor: | ||
Zeile 147: | Zeile 105: | ||
{| class="wikitable" | {| class="wikitable" | ||
|- | |- | ||
| colspan="6" | '''absolute Häufigkeit Einwaage''' | | colspan="6" |'''absolute Häufigkeit Einwaage''' | ||
|- | |- | ||
| Einwaage <math>x_i</math> in g || 495 || 498 || 500 || 516 || Summe | |Einwaage <math>x_i</math> in g||495||498||500||516||Summe | ||
|- | |- | ||
| <math>H(x_i)</math> || 4 || 2 || 3 || 1 || 10 | |<math>H(x_i)</math>||4||2||3||1||10 | ||
|} | |} | ||
<div> | <div> | ||
<!-- Ende Einwaage absolute Häufigkeit--> | <!-- Ende Einwaage absolute Häufigkeit--> | ||
Um das arithmetische Mittel zu berechnen, nutzt man einfach eine zweite mögliche Definition: | Um das arithmetische Mittel zu berechnen, nutzt man einfach eine zweite mögliche Definition: | ||
{{Definition|1= | {{Definition|1= | ||
Ist eine absolute Häufigkeitsverteilung gegeben, so berechnet man das '''arithmetische Mittel''' <math>\bar x</math> als | Ist eine absolute Häufigkeitsverteilung gegeben, so berechnet man das '''arithmetische Mittel''' <math>\bar x</math> als | ||
Zeile 169: | Zeile 124: | ||
{{ | {{Box|Einsatz des Taschenrechners| | ||
Man kann die Häufigkeitsverteilung direkt in den Taschenrechner eingeben und das arithmetische Mittel dann bequem berechnen lassen. | Man kann die Häufigkeitsverteilung direkt in den Taschenrechner eingeben und das arithmetische Mittel dann bequem berechnen lassen.|Üben}} | ||
}} | |||
Eine ausführliche Anleitung gibt es [[../../Einsatz des Taschenrechners/ausführliche Anleitung|hier]]. | |||
Hier also: | |||
<math>\bar x=\frac{1}{10}(495 \cdot 4+498 \cdot 2+500 \cdot 3+516 \cdot 1)=500</math> | <math>\bar x=\frac{1}{10}(495 \cdot 4+498 \cdot 2+500 \cdot 3+516 \cdot 1)=500</math> | ||
===Modus ermitteln=== | |||
Der '''Modus''' ist leicht zu finden: Man liest einfach die höchste absolute Häufigkeit ab und die dazugehörende Merkmalsausprägung <math>x_i</math> liefert den Modus <math>x_{Mod}</math>. | Der '''Modus''' ist leicht zu finden: Man liest einfach die höchste absolute Häufigkeit ab und die dazugehörende Merkmalsausprägung <math>x_i</math> liefert den Modus <math>x_{Mod}</math>. | ||
<!-- Tabelle Einwaage absolute Häufigkeit Modus --> | <!-- Tabelle Einwaage absolute Häufigkeit Modus --> | ||
<div style="float:left; margin-right:1em;"> | <div style="float:left; margin-right:1em;"> | ||
{| class="wikitable" | {| class="wikitable" | ||
|- | |- | ||
| colspan="6" | '''absolute Häufigkeit Einwaage''' | | colspan="6" |'''absolute Häufigkeit Einwaage''' | ||
|- | |- | ||
| Einwaage <math>x_i</math> in g || <span style="background:yellow">495</span> || 498 || 500 || 516 || Summe | |Einwaage <math>x_i</math> in g||<span style="background:yellow">495</span>||498||500||516||Summe | ||
|- | |- | ||
| <math>H(x_i)</math> || <span style="background:yellow">4</span> || 2 || 3 || 1 || 10 | |<math>H(x_i)</math>||<span style="background:yellow">4</span>||2||3||1||10 | ||
|} | |} | ||
<div> | <div> | ||
<!-- Ende Einwaage absolute Häufigkeit Modus --> | <!-- Ende Einwaage absolute Häufigkeit Modus --> | ||
Der Modus liegt bei <math>x_{Mod}=498</math>. | Der Modus liegt bei <math>x_{Mod}=498</math>. | ||
<!-- Ende Fortsetzung 6 Beispiel --> | <!-- Ende Fortsetzung 6 Beispiel --> | ||
Zeile 211: | Zeile 156: | ||
{{ | {{Box|Einsatz des Taschenrechners| | ||
Man kann die Häufigkeitsverteilung direkt in den Taschenrechner eingeben und den Median dann bequem berechnen lassen. Eine ausführliche Anleitung gibt es [[../../Einsatz des Taschenrechners/ausführliche Anleitung|hier]]. | Man kann die Häufigkeitsverteilung direkt in den Taschenrechner eingeben und den Median dann bequem berechnen lassen.|Üben}} | ||
Eine ausführliche Anleitung gibt es [[../../Einsatz des Taschenrechners/ausführliche Anleitung|hier]]. | |||
Im Beispiel mit <math>n=10</math> sucht man also den 5. und 6. Wert: | Im Beispiel mit <math>n=10</math> sucht man also den 5. und 6. Wert: | ||
Zeile 226: | Zeile 168: | ||
{| class="wikitable" | {| class="wikitable" | ||
|- | |- | ||
| colspan="6" | '''absolute Häufigkeit Einwaage''' | | colspan="6" |'''absolute Häufigkeit Einwaage''' | ||
|- | |- | ||
| Einwaage <math>x_i</math> in g || 495 || <span style="background:yellow">498</span> || 500 || 516 || Summe | |Einwaage <math>x_i</math> in g||495||<span style="background:yellow">498</span>||500||516||Summe | ||
|- | |- | ||
| <math>H(x_i)</math> || 4 || <span style="background:yellow">2</span> || 3 || 1 || 10 | |<math>H(x_i)</math>||4||<span style="background:yellow">2</span>||3||1||10 | ||
|} | |} | ||
<div> | <div> | ||
<!-- Ende Einwaage absolute Häufigkeit Median --> | <!-- Ende Einwaage absolute Häufigkeit Median --> | ||
Die erste absolute Häufigkeit ist 4, also kleiner als 5 und 6. | Die erste absolute Häufigkeit ist 4, also kleiner als 5 und 6. | ||
Zeile 245: | Zeile 182: | ||
Die zugehörige Merkmalsausprägung <math>x_2=498</math>: | Die zugehörige Merkmalsausprägung <math>x_2=498</math>: | ||
:: <math>x_{Med}=498</math>. | |||
::<math>x_{Med}=498</math>. | |||
Der Median liegt bei 498 g. | |||
<!-- Ende Fortsetzung 7 Beispiel --> | <!-- Ende Fortsetzung 7 Beispiel --> | ||
Bleibt die Frage: Und wie geht das, wenn die Daten nur als relative Häufigkeitsverteilung vorliegen? | Bleibt die Frage: Und wie geht das, wenn die Daten nur als relative Häufigkeitsverteilung vorliegen? | ||
<div style="float:left; margin-right:1em;"> | <div style="float:left; margin-right:1em;"> | ||
{| class="wikitable" | {| class="wikitable" | ||
|- | |- | ||
| colspan="6" | '''relative Häufigkeit Einwaage''' | | colspan="6" |'''relative Häufigkeit Einwaage''' | ||
|- | |- | ||
| Einwaage <math>x_i</math> in g || 495 || 498 || 500 || 516 || Summe | |Einwaage <math>x_i</math> in g||495||498||500||516||Summe | ||
|- | |- | ||
| <math>h(x_i)</math> || 40% || 20% || 30% || 10% || 100% | |<math>h(x_i)</math>||40%||20%||30%||10%||100% | ||
|} | |} | ||
<!-- Ende Einwaage relative Häufigkeit--> | <!-- Ende Einwaage relative Häufigkeit--> | ||
Zeile 282: | Zeile 214: | ||
}} | }} | ||
<!-- Definition Arithmetisches Mittel relative Häufigkeitsverteilung --> | <!-- Definition Arithmetisches Mittel relative Häufigkeitsverteilung --> | ||
Hier also: | Hier also: | ||
Zeile 295: | Zeile 223: | ||
Den '''Modus''' findet man, indem man die höchste relative Häufigkeit nimmt und die dazugehörende Merkmalsausprägung <math>x_i</math> liefert den Modus <math>x_{Mod}</math>. | Den '''Modus''' findet man, indem man die höchste relative Häufigkeit nimmt und die dazugehörende Merkmalsausprägung <math>x_i</math> liefert den Modus <math>x_{Mod}</math>. | ||
<!-- Tabelle Einwaage relative Häufigkeit Modus --> | <!-- Tabelle Einwaage relative Häufigkeit Modus --> | ||
Zeile 305: | Zeile 228: | ||
{| class="wikitable" | {| class="wikitable" | ||
|- | |- | ||
| colspan="6" | '''relative Häufigkeit Einwaage''' | | colspan="6" |'''relative Häufigkeit Einwaage''' | ||
|- | |- | ||
| Einwaage <math>x_i</math> in g || <span style="background:yellow">495</span> || 498 || 500 || 516 || Summe | |Einwaage <math>x_i</math> in g||<span style="background:yellow">495</span>||498||500||516||Summe | ||
|- | |- | ||
| <math>h(x_i)</math> || <span style="background:yellow">40%</span> || 20% || 30% || 10% || 100% | |<math>h(x_i)</math>||<span style="background:yellow">40%</span>||20%||30%||10%||100% | ||
|} | |} | ||
<div> | <div> | ||
Zeile 321: | Zeile 244: | ||
Der Modus liegt bei 495 g. | Der Modus liegt bei 495 g. | ||
|} | |} | ||
===Median ermitteln=== | |||
Beim Median addiert man die relativen Häufigkeiten bis zu 50 % auf und liest die zugehörige Merkmalsausprägung ab. | Beim Median addiert man die relativen Häufigkeiten bis zu 50 % auf und liest die zugehörige Merkmalsausprägung ab. | ||
Im Beispiel: | Im Beispiel: | ||
Zeile 334: | Zeile 253: | ||
{| class="wikitable" | {| class="wikitable" | ||
|- | |- | ||
| colspan="6" | '''relative Häufigkeit Einwaage''' | | colspan="6" |'''relative Häufigkeit Einwaage''' | ||
|- | |- | ||
| Einwaage <math>x_i</math> in g || 495 || <span style="background:yellow">498</span> || 500 || 516 || Summe | |Einwaage <math>x_i</math> in g||495||<span style="background:yellow">498</span>||500||516||Summe | ||
|- | |- | ||
| <math>h(x_i)</math> || 40% || <span style="background:yellow">20%</span> || 30% || 10% || 100% | |<math>h(x_i)</math>||40%||<span style="background:yellow">20%</span>||30%||10%||100% | ||
|} | |} | ||
<div> | <div> | ||
Zeile 353: | Zeile 272: | ||
'''Interpretation der Ergebnisse:''' | '''Interpretation der Ergebnisse:''' | ||
*Das arithmetische Mittel - also die durchschnittliche Einwaage - liegt bei 500 g. Also haben im Mittel alle Gläser eine Einwaage von 500 g. | |||
{{Merke | *Der Modus (also der am häufigsten vorkommende Wert) liegt bei 495 g. Das ist natürlich eher nicht so gut und könnte zu Kundenreklamationen führen. Aber hier ist zu bedenken, dass der Modus als Maß für die Mitte nur bei großem Stichprobenumfang wirklich aussagekräftig ist. | ||
Das <span style="background:yellow">'''arithmetische Mittel'''</span> (auch <span style="background:yellow">'''Mittelwert'''</span> oder <span style="background:yellow">'''Durchschnitt'''</span>) berechnet sich bei | *Der Median liegt bei 498 g. Das ist allerdings kritisch, da somit mehr die Hälfte aller Gläser eine zu geringe Einwaage aufweisen. | ||
{{Box|1=Merke|2=Das <span style="background:yellow">'''arithmetische Mittel'''</span> (auch <span style="background:yellow">'''Mittelwert'''</span> oder <span style="background:yellow">'''Durchschnitt'''</span>) berechnet sich bei | |||
: gegebener Urliste als | : gegebener Urliste als | ||
:: <math>\bar x=\frac{1}{n}(a_1+a_2+ \cdots +a_{n-1}+a_n)=\frac{1}{n}\sum_{i=1}^n a_i</math> | :: <math>\bar x=\frac{1}{n}(a_1+a_2+ \cdots +a_{n-1}+a_n)=\frac{1}{n}\sum_{i=1}^n a_i</math> | ||
Zeile 380: | Zeile 295: | ||
: das arithmetische Mittel der mittleren Beobachtungswerte <math>a_{n/2}</math> und <math>a_{n/2 +1}</math> in der Mitte der sortierten Urliste bei geradem Stichprobenumfang <math>n</math> | : das arithmetische Mittel der mittleren Beobachtungswerte <math>a_{n/2}</math> und <math>a_{n/2 +1}</math> in der Mitte der sortierten Urliste bei geradem Stichprobenumfang <math>n</math> | ||
: bei gegebener absoluter oder relativer Häufigkeitsverteilung durch Addition der Häufigkeiten bis zur Mitte zu ermitteln. | : bei gegebener absoluter oder relativer Häufigkeitsverteilung durch Addition der Häufigkeiten bis zur Mitte zu ermitteln. | ||
Der Median entspricht nicht in jedem Fall einer Merkmalsausprägung. | Der Median entspricht nicht in jedem Fall einer Merkmalsausprägung.|3=Merksatz}} | ||
}} | |||
== Das passende Lagemaß auswählen== | ==Das passende Lagemaß auswählen== | ||
Lagemaße berechnen ist nicht schwierig, aber welches ist das Richtige? | Lagemaße berechnen ist nicht schwierig, aber welches ist das Richtige? | ||
Zeile 398: | Zeile 312: | ||
== Übungen == | ==Übungen== | ||
'''Ordnen Sie die mathematischen Bezeichnungen und Formeln richtig zu.''' | '''Ordnen Sie die mathematischen Bezeichnungen und Formeln richtig zu.''' | ||
<div class="zuordnungs-quiz"> | <div class="zuordnungs-quiz"> | ||
{| | {| | ||
| arithmetisches Mittel || Durchschnitt || Mittelwert || <math>\bar x</math> | |arithmetisches Mittel||Durchschnitt||Mittelwert||<math>\bar x</math> | ||
|- | |- | ||
| Median || Zentralwert || <math>x_{Med}</math> || der mittlere Wert eines sortierten Urliste | |Median||Zentralwert||<math>x_{Med}</math>||der mittlere Wert eines sortierten Urliste | ||
|- | |- | ||
| Modus || <math>x_{Mod}</math> || der häufigste Wert || Modalwert | |Modus||<math>x_{Mod}</math>||der häufigste Wert||Modalwert | ||
|} | |} | ||
</div> | </div> | ||
Zeile 417: | Zeile 331: | ||
<div class="zuordnungs-quiz"> | <div class="zuordnungs-quiz"> | ||
{| | {| | ||
| Urliste || <math>\frac{1}{n}(a_1+a_2+ \cdots +a_{n-1}+a_n)</math> || <math>\frac{1}{n}\sum_{i=1}^n a_i</math> | |Urliste||<math>\frac{1}{n}(a_1+a_2+ \cdots +a_{n-1}+a_n)</math>||<math>\frac{1}{n}\sum_{i=1}^n a_i</math> | ||
|- | |- | ||
| absolute Häufigkeitsverteilung || <math>\frac{1}{n}(x_1 \cdot H(x_1)+x_2 \cdot H(x_2)+ \cdots +x_{k-1} \cdot H(x_{k-1})+x_k \cdot H(x_k))</math> | |absolute Häufigkeitsverteilung||<math>\frac{1}{n}(x_1 \cdot H(x_1)+x_2 \cdot H(x_2)+ \cdots +x_{k-1} \cdot H(x_{k-1})+x_k \cdot H(x_k))</math>||<math>\frac{1}{n}\sum_{i=1}^k x_i \cdot H(x_i)</math>||<math>\frac{1}{n}\sum_{i=1}^k x_i \cdot H_i</math> | ||
|- | |- | ||
| relative Häufigkeitsverteilung || <math>x_1 \cdot h(x_1)+x_2 \cdot h(x_2)+ \cdots +x_{k-1} \cdot h(x_{k-1})+x_k \cdot h(x_k)</math> || <math>\sum_{i=1}^k x_i \cdot h(x_i)</math> || <math>\sum_{i=1}^k x_i \cdot h_i</math> | |relative Häufigkeitsverteilung||<math>x_1 \cdot h(x_1)+x_2 \cdot h(x_2)+ \cdots +x_{k-1} \cdot h(x_{k-1})+x_k \cdot h(x_k)</math>||<math>\sum_{i=1}^k x_i \cdot h(x_i)</math>||<math>\sum_{i=1}^k x_i \cdot h_i</math> | ||
|} | |} | ||
</div> | </div> | ||
Zeile 551: | Zeile 465: | ||
a) | a) | ||
{| | {| | ||
| Bewertung der Ausstattung und Optik || Anzahl der Schüler | |Bewertung der Ausstattung und Optik||Anzahl der Schüler | ||
|- | |- | ||
| 1 (sehr gut) || 43 | |1 (sehr gut)||43 | ||
|- | |- | ||
| 2 (gut) || 22 | |2 (gut)||22 | ||
|- | |- | ||
| 3 (befriedigend) || 15 | |3 (befriedigend)||15 | ||
|- | |- | ||
| 4 (ausreichend) || 36 | |4 (ausreichend)||36 | ||
|- | |- | ||
| 5 (mangelhaft) || 21 | |5 (mangelhaft)||21 | ||
|- | |- | ||
|6 (ungenügend) || 24 | |6 (ungenügend)||24 | ||
|} | |} | ||
b) | b) | ||
{| | {| | ||
| Bewertung der Ausstattung und Optik || Anzahl der Schüler | |Bewertung der Ausstattung und Optik||Anzahl der Schüler | ||
|- | |- | ||
| 1 (sehr gut) || 25 | |1 (sehr gut)||25 | ||
|- | |- | ||
| 2 (gut) || 29 | |2 (gut)||29 | ||
|- | |- | ||
| 3 (befriedigend) || 28 | |3 (befriedigend)||28 | ||
|- | |- | ||
| 4 (ausreichend) || 27 | |4 (ausreichend)||27 | ||
|- | |- | ||
| 5 (mangelhaft) || 28 | |5 (mangelhaft)||28 | ||
|- | |- | ||
|6 (ungenügend) || 24 | |6 (ungenügend)||24 | ||
|} | |} | ||
Zeile 612: | Zeile 526: | ||
{{Beschreibende Statistik}} | {{Beschreibende Statistik}} | ||
== Lernziele == | ==Lernziele== | ||
Sie kennen die Begriffe | Sie kennen die Begriffe | ||
* Grundgesamtheit, Stichprobe, Stichprobenumfang, | |||
* Merkmal, Merkmalsausprägung, Beobachtungswert, Urliste, Merkmalsträger, | *Grundgesamtheit, Stichprobe, Stichprobenumfang, | ||
* arithmetisches Mittel, Modus, Median, | *Merkmal, Merkmalsausprägung, Beobachtungswert, Urliste, Merkmalsträger, | ||
* absolute und relative Häufigkeitsverteilung, | *arithmetisches Mittel, Modus, Median, | ||
* Klassen, Klassenanzahl, Spannweite und Klassenbreite. | *absolute und relative Häufigkeitsverteilung, | ||
*Klassen, Klassenanzahl, Spannweite und Klassenbreite. | |||
Sie können | Sie können | ||
* diesen Begriffen die mathematischen Bezeichnungen zuordnen und | |||
* sie im Sachkontext richtig anwenden. | *diesen Begriffen die mathematischen Bezeichnungen zuordnen und | ||
*sie im Sachkontext richtig anwenden. | |||
Sie können zu gegebenen Daten | Sie können zu gegebenen Daten | ||
* eine passende graphische Darstellung auswählen und | |||
* die Daten graphisch aussagekräftig aufbereiten. | *eine passende graphische Darstellung auswählen und | ||
*die Daten graphisch aussagekräftig aufbereiten. | |||
Sollten Sie unsicher sein, so finden Sie alle nötigen Informationen hier: | Sollten Sie unsicher sein, so finden Sie alle nötigen Informationen hier: | ||
Zeile 632: | Zeile 551: | ||
<!-- Beispiele fehlen noch --> | <!-- Beispiele fehlen noch --> | ||
{{Beschreibende Statistik}} | {{Beschreibende Statistik}} |
Aktuelle Version vom 16. Oktober 2022, 12:44 Uhr
Mithilfe von Lagemaßen wird die Vielzahl der Daten einer Häufigkeitsverteilung auf eine Kennzahl reduziert. Oft ist es gar nicht so wichtig, wie ein Häufigkeitsverteilung im Einzelnen aussieht. Man interessiert sich vielmehr für den mittleren Wert. Die Merkmalsausprägungen gruppieren sich um die Mitte. Ein Lagemaß charakterisiert die Lage einer Verteilung.
Sie lernen hier drei verschiedene Lagemaße kennen und anwenden:
- das arithmetische Mittel (auch Durchschnitt oder Mittelwert),
- den Modus (auch Modalwert) und
- den Median (auch Zentralwert).
Jedes einzelne dieser Lagemaße kann sinnvoll sein, je nachdem welche Merkmalsart vorliegt und wie die Häufigkeitsverteilung aussieht.
Info
Einwaage Marmelade
Urliste Einwaage | ||||||||||
Einwaage in g | 495 | 500 | 495 | 495 | 516 | 495 | 500 | 500 | 498 | 498 |
Die PurFrucht GmbH produziert Marmelade. Diese wird maschinell in Gläser zu je 500 g abgefüllt. Aufgrund eines Einstellungsfehlers variiert die Einwaage jedoch und eine Stichprobe von 10 Gläsern hat folgendes Ergebnis geliefert:
Wie gut arbeitet die Maschine? Wie sollten die Einstellungen angepasst werden, um ein besseres Ergebnis zu erzielen?
Arithmetisches Mittel
Das arithmetische Mittel ist die Summe aller Beobachtungswerte dividiert durch den Stichprobenumfang .
Mathematische Kurzschreibweise:
Eine ausführliche Anleitung gibt es hier.
Diese Definition des arithmetischen Mittels liefert:
Das arithmetische Mittel liegt bei 500 g.
Modus
Um den Modus zu berechnen ist es sinnvoll, die Urliste zu sortieren:
sortierte Urliste Einwaage | ||||||||||
Einwaage in g | 495 | 495 | 495 | 495 | 498 | 498 | 500 | 500 | 500 | 516 |
Jetzt lässt sich leicht ablesen:
Der Modus liegt bei 495 g.
Median
Eine ausführliche Anleitung gibt es hier.
Betrachtet man also die sortierte Urliste, so erkennt man:
sortierte Urliste Einwaage | ||||||||||
Einwaage in g | 495 | 495 | 495 | 495 | 498 | 498 | 500 | 500 | 500 | 516 |
Hier berechnet sich der Median als arithmetisches Mittel der mittleren beiden Werte:
Der Median liegt bei 498 g.
Lagemaße ermitteln
Nicht immer ist eine Urliste oder eine sortierte Urliste gegeben. Oft sind die Daten auch schon als absolute oder relative Häufigkeitsverteilung aufbereitet. Wie kommt man dann an die verschiedenen Lagemaße?
Angenommen, die Daten aus dem obigen Beispiel lägen nur als absolute Häufigkeitsverteilung vor:
absolute Häufigkeit Einwaage | |||||
Einwaage in g | 495 | 498 | 500 | 516 | Summe |
4 | 2 | 3 | 1 | 10 |
Um das arithmetische Mittel zu berechnen, nutzt man einfach eine zweite mögliche Definition:
Ist eine absolute Häufigkeitsverteilung gegeben, so berechnet man das arithmetische Mittel als
Eine ausführliche Anleitung gibt es [[../../Einsatz des Taschenrechners/ausführliche Anleitung|hier]].
Hier also:
Modus ermitteln
Der Modus ist leicht zu finden: Man liest einfach die höchste absolute Häufigkeit ab und die dazugehörende Merkmalsausprägung liefert den Modus .
absolute Häufigkeit Einwaage | |||||
Einwaage in g | 495 | 498 | 500 | 516 | Summe |
4 | 2 | 3 | 1 | 10 |
Der Modus liegt bei .
Beim Median addiert man die absoluten Häufigkeiten solange auf, bis man zur Mitte des Stichprobenumfangs gelangt ist.
Eine ausführliche Anleitung gibt es [[../../Einsatz des Taschenrechners/ausführliche Anleitung|hier]].
Im Beispiel mit sucht man also den 5. und 6. Wert:
absolute Häufigkeit Einwaage | |||||
Einwaage in g | 495 | 498 | 500 | 516 | Summe |
4 | 2 | 3 | 1 | 10 |
Die erste absolute Häufigkeit ist 4, also kleiner als 5 und 6.
Die nächste ist absolute Häufigkeit ist 2, 4+2=6, also Ziel erreicht.
Die zugehörige Merkmalsausprägung :
- .
Der Median liegt bei 498 g.
Bleibt die Frage: Und wie geht das, wenn die Daten nur als relative Häufigkeitsverteilung vorliegen?
relative Häufigkeit Einwaage | |||||
Einwaage in g | 495 | 498 | 500 | 516 | Summe |
40% | 20% | 30% | 10% | 100% |
|}
Um das arithmetische Mittel zu berechnen, nutzt man einfach die dritte mögliche Definition:
Ist eine relative Häufigkeitsverteilung gegeben, so berechnet man das arithmetische Mittel als
Hier also:
Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle \bar x=495 \cdot 40%+498 \cdot 20%+500 \cdot 30%+516 \cdot 10%=500}
Das arithmetische Mittel liegt bei 500 g. |}
Den Modus findet man, indem man die höchste relative Häufigkeit nimmt und die dazugehörende Merkmalsausprägung liefert den Modus .
relative Häufigkeit Einwaage | |||||
Einwaage in g | 495 | 498 | 500 | 516 | Summe |
40% | 20% | 30% | 10% | 100% |
| |- |colspan="7"|
Der Modus liegt bei 495 g.
|}
Median ermitteln
Beim Median addiert man die relativen Häufigkeiten bis zu 50 % auf und liest die zugehörige Merkmalsausprägung ab.
Im Beispiel:
relative Häufigkeit Einwaage | |||||
Einwaage in g | 495 | 498 | 500 | 516 | Summe |
40% | 20% | 30% | 10% | 100% |
Die erste relative Häufigkeit beträgt 40%, also kleiner als 50%.
Die nächste ist absolute Häufigkeit beträgt 20%, 40%+20%=60%, also Ziel erreicht.
Die zugehörige Merkmalsausprägung liefert den Median: .
Der Median liegt bei 498 g.
Interpretation der Ergebnisse:
- Das arithmetische Mittel - also die durchschnittliche Einwaage - liegt bei 500 g. Also haben im Mittel alle Gläser eine Einwaage von 500 g.
- Der Modus (also der am häufigsten vorkommende Wert) liegt bei 495 g. Das ist natürlich eher nicht so gut und könnte zu Kundenreklamationen führen. Aber hier ist zu bedenken, dass der Modus als Maß für die Mitte nur bei großem Stichprobenumfang wirklich aussagekräftig ist.
- Der Median liegt bei 498 g. Das ist allerdings kritisch, da somit mehr die Hälfte aller Gläser eine zu geringe Einwaage aufweisen.
Das arithmetische Mittel (auch Mittelwert oder Durchschnitt) berechnet sich bei
- gegebener Urliste als
- gegebener absoluter Häufigkeitsverteilung als
- gegebener relativer Häufigkeitsverteilung als
Das arithmetische Mittel entspricht nicht immer einer Merkmalsausprägung der Urliste.
Der Modus (auch Modalwert) ist
- bei gegebener Urliste der Beobachtungswert, der am häufigsten vorkommt.
- bei absoluter oder relativer Häufigkeitsverteilung die Merkmalsausprägung, die am häufigsten vorkommt.
Der Modus muss nicht eindeutig sein, entspricht aber in jedem Fall einer Merkmalsausprägung.
Der Median (auch Zentralwert) ist
- der Beobachtungswert in der Mitte der sortierten Urliste bei ungeradem Stichprobenumfang
- das arithmetische Mittel der mittleren Beobachtungswerte und in der Mitte der sortierten Urliste bei geradem Stichprobenumfang
- bei gegebener absoluter oder relativer Häufigkeitsverteilung durch Addition der Häufigkeiten bis zur Mitte zu ermitteln.
Das passende Lagemaß auswählen
Lagemaße berechnen ist nicht schwierig, aber welches ist das Richtige?
Diese Frage ist nicht leicht und schon gar nicht einfach zu beantworten.
Der Modus ist toll bei großen Datenmengen. Er ist unempfindlich gegenüber Ausreißern in den Beobachtungswerten und er kann auch bei qualitativen Merkmalen verwendet werden. Außerdem ist sichergestellt, dass der Modus immer auch eine Merkmalsausprägung ist.
Der Median ist auch unempfindlich gegenüber Ausreißern in den Beobachtungswerten. Aber um mit dem Median arbeiten zu können, müssen qualitative Merkmale eine Ordinalskala haben, für qualitative Merkmale mit Nominalskala bleibt nur der Modus. Es kann allerdings passieren, dass der Median einen Wert annimmt, der als Merkmalsausprägung nicht vorkommt.
Das arithmetische Mittel lässt sich nur bei qualitativen Merkmalen anwenden. Leider reagiert das arithmetische Mittel aber sehr empfindlich auf Ausreißer und ist dann wenig aussagekräftig. Auch bei dem arithmetischen Mittel ist es möglich, dass ein Wert ermittelt wird, der als Merkmalsausprägung nicht vorkommt.
Es ist also in jedem einzelnen Fall zu prüfen, welches Lagemaß für das bestimmte Merkmal mit der gegebenen Häufigkeitsverteilung am besten geeignet ist.
Übungen
Ordnen Sie die mathematischen Bezeichnungen und Formeln richtig zu.
arithmetisches Mittel | Durchschnitt | Mittelwert | |
Median | Zentralwert | der mittlere Wert eines sortierten Urliste | |
Modus | der häufigste Wert | Modalwert |
Ordnen Sie die mathematischen Bezeichnungen und Formeln richtig zu, wenn die Daten als ... vorliegen.
Urliste | |||
absolute Häufigkeitsverteilung | |||
relative Häufigkeitsverteilung |
Gegeben sind die folgenden Urlisten:
- 5; 7; 8; 7; 10; 10; 7; 6
- 5; 7; 8; 7; 10; 10; 7; 6; 48
- 5; 7; 8; 7; 10; 10; 7; 6; 48; 2
Bestimmen Sie Modus, Median und arithmetisches Mittel für jede der drei Listen.
Die erste Liste sortieren, Stichprobenumfang
- 5; 6; 7; 7; 7; 8; 10; 10
Modus Median arithmetisches Mittel
Da alle drei Lagemaße nah beieinander liegen, kann man davon ausgehen, dass es hier keine Ausreißer gibt und man jedes als Maß für die Mitte der Verteilung nutzen kann.
Die zweite Liste sortieren, Stichprobenumfang
- 5; 6; 7; 7; 7; 8; 10; 10; 48
Modus Median arithmetisches Mittel
Bemerkung: Hier sieht man den Einfluß, den der neu dazugekommene Ausreißer 48 auf das arithmetische Mittel hat. Es ist das Einzige der drei Lagemaße, dass auf den neuen Wert reagiert. Hier ist das arithmetische Mittel nicht geeignet, die Mitte der Verteilung zu beschreiben.
Die dritte Liste sortieren, Stichprobenumfang
- 2; 5; 6; 7; 7; 7; 8; 10; 10; 48
Modus Median arithmetisches Mittel
Bemerkung: Auch hier sieht man den Einfluß, den der neu dazugekommene zweite Ausreißer 2 auf das arithmetische Mittel hat. Es ist wieder das Einzige der drei Lagemaße, dass auf den neuen Wert reagiert. Hier ist das arithmetische Mittel nicht geeignet, die Mitte der Verteilung zu beschreiben.
Die Firma Schmidt&Müller GmbH produziert unter anderem Schrauben mit einer Solllänge von 60 mm. In der Qualitätskontrolle werden der laufenden Produktion 20 Schrauben entnommen und die Beobachtungswerte (in mm) notiert:
59,5; 60,5; 60,0; 59,5; 59,5; 61,9; 59,5; 59,8; 60,3; 60,9; 61,5; 61,0; 60,2; 61,2; 60,3; 58,9; 60,8; 59,5; 58,5; 59,2
- Bestimmen Sie das arithmetische Mittel und den Median der Verteilung.
- Vergleichen Sie die beiden Lagemaße.
- Bei der 21. Entnahme wird eine besonders kurze Schraube von 57,0 mm entnommen. Wie beeinflusst diese Schraube arithmetisches Mittel und Median der Verteilung?
Am einfachsten findet man die Lösung durch Einsatz eines Tabellenkalkulationsprogramms.
Die ersten 20 Beobachtungswerte liefern: Median mm arithmetisches Mittel mm.
Sowohl der Durchschnitt als auch das Zentrum der Verteilung liegen über dem Sollwert von 60 mm. Der Median ist mit 60,1 mm weiter vom Sollwert entfernt als das arithmetische Mittel von 60,08 mm.
Die ersten 21 Beobachtungswerte liefern: Median mm arithmetisches Mittel
Beide Werte verändern sich nach unten. Der Durchschnitt liegt jetzt unter der Solllänge von 60 mm, das Zentrum der Verteilung liegt genau bei 60 mm.
Die Schülerinnen und Schüler des bkh nehmen an einer Befragung teil, in der die Ausstattung und Optik der Schule bewertet werden soll.
Bestimmen Sie jeweils
- das arithmetische Mittel,
- den Median (Zentralwert) und
- den Modus (Modalwert) der Ergebnisse.
Entscheiden Sie begründet, welches Lagemaß die höchste Aussagekraft hat.
a)
Bewertung der Ausstattung und Optik | Anzahl der Schüler |
1 (sehr gut) | 43 |
2 (gut) | 22 |
3 (befriedigend) | 15 |
4 (ausreichend) | 36 |
5 (mangelhaft) | 21 |
6 (ungenügend) | 24 |
b)
Bewertung der Ausstattung und Optik | Anzahl der Schüler |
1 (sehr gut) | 25 |
2 (gut) | 29 |
3 (befriedigend) | 28 |
4 (ausreichend) | 27 |
5 (mangelhaft) | 28 |
6 (ungenügend) | 24 |
Stichprobenumfang
a) Modus (sehr gut) (der häufigste Wert) Median durch summieren der Häufigkeiten bis 81, zugehörige Merkmalsausprägung ablesen (ausreichend) (das Zentrum der Verteilung) Arithmetisches Mittel (der Mittelwert oder Durchschnitt der Verteilung)
b) Modus (gut) (der häufigste Wert) Median durch summieren der Häufigkeiten bis 81, zugehörige Merkmalsausprägung ablesen (befriedigend) (das Zentrum der Verteilung) Arithmetisches Mittel (der Mittelwert oder Durchschnitt der Verteilung)
Der Modus ist nicht so aussagekräftig wie der Median, da der Stichprobenumfang nicht besonders groß ist.
Das arithmetische Mittel kann zwar berechnet werden, aber es kommt selbst als Merkmalsausprägung nicht vor. Hier verhält es sich so ähnlich wie der Durchschnitt aller Noten in einer Klassenarbeit. Das Merkmal ist qualitativ mit Ordinalskala.
Aufgabe 6
Lernpfad Beschreibende Statistik
- Grundbegriffe
- Graphische Darstellungen von Häufigkeitsverteilungen
- Lagemaße
(arithmetisches Mittel, Modus, Median) - Streuungsmaße
(mittlere absolute Abweichung, mittlere quadratische Abweichung, Standardabweichung) - Einsatz des Taschenrechners
(Bedienung Casio fx-991DE PLUS)
Lernziele
Sie kennen die Begriffe
- Grundgesamtheit, Stichprobe, Stichprobenumfang,
- Merkmal, Merkmalsausprägung, Beobachtungswert, Urliste, Merkmalsträger,
- arithmetisches Mittel, Modus, Median,
- absolute und relative Häufigkeitsverteilung,
- Klassen, Klassenanzahl, Spannweite und Klassenbreite.
Sie können
- diesen Begriffen die mathematischen Bezeichnungen zuordnen und
- sie im Sachkontext richtig anwenden.
Sie können zu gegebenen Daten
- eine passende graphische Darstellung auswählen und
- die Daten graphisch aussagekräftig aufbereiten.
Sollten Sie unsicher sein, so finden Sie alle nötigen Informationen hier:
Grundbegriffe der beschreibenden Statistik
Lernpfad Beschreibende Statistik
- Grundbegriffe
- Graphische Darstellungen von Häufigkeitsverteilungen
- Lagemaße
(arithmetisches Mittel, Modus, Median) - Streuungsmaße
(mittlere absolute Abweichung, mittlere quadratische Abweichung, Standardabweichung) - Einsatz des Taschenrechners
(Bedienung Casio fx-991DE PLUS)