Beschreibende Statistik/Klassenbildung: Unterschied zwischen den Versionen
main>Matthias Scharwies K (Matthias Scharwies verschob Seite Beschreibende Statistik/Grundbegriffe der beschreibenden Statistik/Klassenbildung nach Beschreibende Statistik/Grundbegriffe/Klassenbildung) |
main>Matthias Scharwies K (Matthias Scharwies verschob Seite Beschreibende Statistik/Grundbegriffe/Klassenbildung nach Beschreibende Statistik/Klassenbildung, ohne dabei eine Weiterleitung anzulegen) |
(kein Unterschied)
|
Version vom 15. April 2019, 08:43 Uhr
Man kann jede Art von Merkmalen klassieren. Das geht sogar bei qualitativen Merkmalen mit einer Nominalskala.
Beispiel Merkmal Lieblingsfarbe |
Sind zum Beispiel die Farben hellgelb, gelb, sonnengelb, rot, grün, hellblau, mittelblau, himmelblau und dunkelblau unter den Merkmalsausprägungen, so könnte man die Klassen
Dies wird auch bei der Auswertung von Wahlergebnissen im Fernsehen gemacht, die kleineren, nicht so wichtigen Parteien werden unter "Andere" zusammengefasst. |
Bei qualitativen Merkmalen mit einer Ordinalskala wird man immer darauf achten, dass aufeinander folgende Merkmalsausprägungen zusammengefasst werden.
Beispiel Merkmal Note Mathematikarbeit |
Betrachtet man die Noten der letzten Mathematikarbeit, so könnte man die Klassen
um eine knappe Übersicht über die Lerngruppe zu erhalten. |
Im Folgenden werden aber nur noch quantitative Merkmale betrachtet.
Nicht immer macht es Sinn, alle verschiedenen Merkmalsausprägungen einzeln zu betrachten. Bei quantitativen Merkmalen fasst man oft verschiedene Merkmalsausprägungen zu Klassen zusammen.
Beispiel Körpergröße (in cm)
Betrachtet man zum Beispiel die Körpergröße (in cm) der Schüler und Schülerinnen der Klasse HHU5 am Berufskolleg Hattingen (Schuljahr 2012/2013):
Wenn man hier die verschiedenen Merkmalsausprägungen mit ihren absoluten und relativen Häufigkeiten erfasst, ist noch nicht wirklich etwas gewonnen, da es 18 verschiedene Merkmalsausprägungen gibt, von denen sieben die absolute Häufigkeit 2 und alle anderen die absolute Häufigkeit 1 haben. (Der geneigte Leser mag das selber nachrechnen.) Man könnte zum Beispiel die Frage "Wie viele Schüler sind größer als 175 cm und höchstens 183 cm? stellen. Dann ist es sinnvoll, eine absolute Häufigkeitsverteilung mit drei verschiedenen Klassen zu bilden. Jede Klasse hat eine untere und eine obere Grenze. Wichtig ist, dass sich die Klassen nicht überschneiden, damit jeder Beobachtungswert nur genau zu einer Klasse gehört. | ||||||||||||||||||||||||||||||||||||||||||||
Klasseneinteilung: Klasse :
Klasse :
Klasse :
Häufigkeitsverteilung bestimmen: Jetzt kann man die absolute Häufigkeit zu jeder Klasse bestimmen, indem man alle Beobachtungswerte zählt, die im Intervall der Klasse liegen. Dann lässt sich auch die relative Häufigkeit zu jeder Klasse bestimmen, indem man den Anteil aller Beobachtungswerte am Stichprobenumfang , die im Intervall der Klasse liegen, berechnet.
| ||||||||||||||||||||||||||||||||||||||||||||
Interpretation: Es sind also nicht nur vier Schüler größer als 175 cm und höchstens 183 cm. Es sieht so aus, als wären die Schüler der Klasse entweder klein oder groß, weil die Klasse in der Mitte so selten vertreten ist.
Stimmt das denn?
Hier ist es hilfreich, sich mit den Klassenbreiten zu beschäftigen.
Klassenbreiten bestimmen:
Die gewählten Klassen sind unterschiedlich breit. Die Breite einer Klasse errechnet man, indem man die untere Grenze von der oberen Grenze subtrahiert.
| ||||||||||||||||||||||||||||||||||||||||||||
Jetzt sieht man, dass die mittlere Klasse auch viel schmaler ist, als die beiden anderen Klassen. Die Klassenbreite hat aber Einfluss auf die Häufigkeit, mit der die Beobachtungswerte in der Klasse liegen. Deshalb wählt man in der Regel Klassen mit gleicher Klassenbreite. Nur in Ausnahmefällen machen Klassen mit unterschiedlichen Klassenbreiten Sinn. Ganz besonders gut geeignet sind unterschiedliche Klassenbreiten, wenn man schon vorher weiß, welche Aussage man mit den Daten unterstützen möchte. Auch die obige Fragestellung hätte man prima mit gleich breiten Klassen lösen können. Dabei beginnt man dann mit dem aus der Frage vorgegebenen Intervall und bildet alle nötigen Klassen darunter und darüber mit Klassenbreite 8 cm so, dass man auch den kleinsten und den größten Beobachtungswert einer Klasse zuordnen kann. Das sieht dann so aus:
| ||||||||||||||||||||||||||||||||||||||||||||
Interpretation: | ||||||||||||||||||||||||||||||||||||||||||||
Man kann leicht erkennen, dass es - unter Berücksichtigung der Klassenbreite - nur zwei Klassen gibt, in denen sich mehr Beobachtungswerte befinden. So erhält man also ein ganz anderes Bild der Verteilung. |
Man unterscheidet zwei Arten von Klassenbildungen:
- Klassen mit gleicher Klassenbreite
- Klassen mit unterschiedlicher Klassenbreite
Übrigens eignen sich Klassen mit unterschiedlicher Klassenbreite hervorragend, um Daten so aufzubereiten, dass sie die gewünschte Aussage (hier entweder eine Klasse mit besonders großen Schülern oder mit besonders kleinen Schülern) gut unterstützen. Hier gilt der allseits beliebte Spruch: "Traue keiner Statistik, die du nicht selbst gefälscht hast."