Beschreibende Statistik/Grundbegriffe
Los geht's mit den Grundbegriffen der beschreibenden Statistik. Zunächst gibt es eine Übersicht über alles, was Sie im ersten Kapitel erwartet.
- Grundgesamtheit, Stichprobe und Stichprobenumfang
- Merkmal und Merkmalsausprägungen
- Qualitative und Quantitative Merkmale, Skalen
- Absolute und Relative Häufigkeiten
- Klassenbildung
Befragung
Die Grundlage einer jeden statistischen Erhebung ist die Befragung oder Untersuchung. Die Beobachtungswerte werden in einer Urliste gesammelt und sind zunächst recht unübersichtlich. Hier lernen Sie zunächst die Aufbereitung der Daten als Häufigkeitsverteilung schrittweise kennen und nutzen.
Einführungsbeispiel - Umfrage
Die Eisdiele „Rabe“ in Hattingen hat im Mai 2014 unter ihren Kunden eine Umfrage zur Verbesserung ihres Angebots gemacht. Hierzu wurden stichprobenartig 30 Kunden befragt.
Das Ergebnis der Umfrage liegt als ungeordnete Liste (siehe Tabelle rechts) vor. Auf den ersten Blick lässt sich kein Ergebnis erkennen, welches zur Verbesserung des Angebots der Eisdiele führen könnte. Also müssen die erhobenen Daten so aufbereitet werden, dass sich eine Aussage ablesen lässt. Die verschiedenen Möglichkeiten zur Aufbereitung der vorliegenden Daten wird an diesem Beispiel schrittweise durchgeführt. Die dazu benötigten Grundbegriffe werden eingeführt.
Merksätze
Herzlichen Glückwunsch! Sie haben das erste Kapitel erfolgreich abgeschlossen.
Ihr Regelheft enthält schon viele Informationen. Überprüfen Sie, ob Sie alles notiert haben.;
- Regelheft
Eine Grundgesamtheit ist die Menge aller möglichen Objekte, über die man eine Aussage machen möchte.
Die Grundgesamtheit kann
- - begrenzt (z. B. alle Schüler der Klasse HHU5 des Berufskollegs Hattingen),
- - sehr groß (z. B. alle Einwohner Deutschlands im Jahr 2014) oder
- - unbegrenzt sein.
Eine Stichprobe ist eine Teilmenge der Grundgesamtheit; ihre Größe ist immer begrenzt.
Der Stichprobenumfang gibt die Größe der Stichprobe an.
Jede in einer statistischen Erhebung untersuchte Frage heißt Merkmal.
Die einzelnen Antworten heißen Beobachtungswerte und werden getrennt nach Merkmalen in einer Urliste festgehalten. Die Beobachtungswerte werden mit bezeichnet.
Die Anzahl aller Beobachtungswerte ist gleich dem Stichprobenumfang .
Zu einer Stichprobe vom Umfang gibt es in der zugehörigen Urliste die Beobachtungswerte .
Die verschiedenen Werte die ein Merkmal annimmt, werden Merkmalsausprägungen genannt und mit bezeichnet. Es kann höchstens so viele Merkmalsausprägungen geben, wie es Beobachtungswerte in der Urliste gibt. In der Regel wird die Anzahl der Merkmalsausprägungen kleiner sein als der Stichprobenumfang. Die zu einem Merkmal gehörenden Ausprägungen werden mit bezeichnet.
Jedes Element der Stichprobe einer statistischen Erhebung ist ein Merkmalsträger bezogen auf die untersuchten Merkmale.
Man unterscheidet in
- quantitative Merkmale, deren Merkmalsausprägungen aus Zahlen oder Größenwerten bestehen
- mit metrisch diskreter Skala (nur ganze Zahlen)
- mit metrisch stetiger Skala (alle Kommazahlen)
- qualitative Merkmale, deren Merkmalausprägungen in Textform oder als Zahlwerte (ohne mögliche sinnvolle Rechenoperationen) gegeben sind
- mit Ordinalskala (die Merkmalsausprägungen lassen sich in eine natürliche Reihenfolge bringen)
- mit Nominalskala (die Merkmalsausprägungen haben keine Wertigkeit)
Die absolute Häufigkeit gibt die Anzahl aller Merkmalsträger mit dieser Merkmalsausprägung an.
Statt schreibt man auch kurz .
Die relative Häufigkeit gibt den Anteil aller Merkmalsträger mit dieser Merkmalsausprägung bezogen auf den Stichprobenumfang an.
Statt schreibt man auch kurz .
Die Summe der absoluten Häufigkeiten ist immer gleich der Anzahl aller Merkmalsträger, also gleich dem Stichprobenumfang.
Mathematische Kurzschreibweise:
- oder noch kürzer ,
wobei die Anzahl der Merkmalsausprägungen und den Stichprobenumfang bezeichnen.
Eine Darstellung der Merkmalsausprägungen mit absoluten Häufigkeiten nennt man absolute Häufigkeitsverteilung.
Die Summe der relativen Häufigkeiten ist immer gleich 1, also 100 %.
Mathematische Kurzschreibweise:
- oder noch kürzer ,
wobei die Anzahl der Merkmalsausprägungen und den Stichprobenumfang bezeichnen.
Eine Darstellung der Merkmalsausprägungen mit relativen Häufigkeiten nennt man relative Häufigkeitsverteilung.
Die einzelnen Klassen bezeichnet man mit , wobei gilt.
Klassenanzahl:
Spannweite:
Klassenbreite:
Bei Klassen mit unterschiedlichen Breiten ist jeder Klasse ihre Breite zuzuordnen
Vorsicht bei Statistiken mit unterschiedlich breiten Klassen. Hier weiß man nie, was der Autor verstecken will.
Lernpfad Beschreibende Statistik
- Grundbegriffe
- Graphische Darstellungen von Häufigkeitsverteilungen
- Lagemaße
(arithmetisches Mittel, Modus, Median) - Streuungsmaße
(mittlere absolute Abweichung, mittlere quadratische Abweichung, Standardabweichung) - Einsatz des Taschenrechners
(Bedienung Casio fx-991DE PLUS)