Signifikanztest für binomialverteilte Zufallsgrößen/Aufbau und Durchführung eines Signifikanztests

Aus ZUM-Unterrichten


Die Grundidee vom Signifikanztest hast du bereits verstanden. Auf dieser Seite lernst du nun den Aufbau und die Begrifflichkeiten eines Signifikanztests kennen.

Ein Signifikanztest besteht aus vier Schritten.

Vorüberlegung und Schritte .png

Im Folgenden werden die einzelnen Schritte ausführlich beschrieben. Lies dir die Beschreibungen aufmerksam durch, im Anschluss gibt es zwei Übungen, indem du eigenständig einen Signifikanztest durchführst.

Vorüberlegung:
Skizziere die Binomialverteilung für die Stichprobe mit der bisher geltenden Wahrscheinlichkeit . Kläre die Frage, ob durch bestimmte Einflüsse vermutet wird, dass die bisherige Wahrscheinlichkeit gesunken bzw. gestiegen ist. Falls die Vermutung vorliegt, dass die Wahrscheinlichkeit gesunken ist, liegt ein linksseitiger Test vor, so markiere den linken Rand der Binomialverteilung. Liegt der Verdacht vor, dass die Wahrscheinlichkeit gestiegen ist, so handelt es sich um ein rechtsseitigen Test und es ist der rechte Rand der Veteilung zu markieren.

1. Schritt: Wahl der Nullhypothese  und der Gegenhypothese
Die Nullhypothese beschreibt die Wahrscheinlichkeit , die bisher für die Grundgesamtheit galt . Durch bestimmte Einflüsse wird vermutet, dass gesunken bzw. gestiegen ist. Diese Vermutung wird durch die Gegenhypothese ausgedrückt. lautet also entweder bzw. . Das Ziel des Signifikanztests ist es, die Nullhypothese zu verwerfen. Wird die Nullhypothese verworfen, so ist mit einer großen statistischen Sicherheit gezeigt, dass die Gegenhypothese gilt.

2. Schritt: Festlegen des Stichprobenumfangs n und des Signifikanzniveaus
Der Stichprobenumfang n und das Signifikanzniveau sind meistens in der Aufgabenstellung angegeben. Diese Größen musst du also einfach nur aus dem Aufgabentext rausschreiben. Das Signifikanzniveau legt die Irrtumswahrscheinlichkeit fest, eine Nullhypothese fälschlicherweise zu verwerfen. Die Höhe des Signifikanzniveaus legt der Auftragsgeber vor der Durchführung des Tests fest. Ein üblicher Wert ist Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle \alpha=5%} , manchmal wird aber auch ein strenges Niveau von Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle \alpha=1%} gewählt.

3. Schritt: Definition der Zufallsvariable X und angeben der Verteilung wenn  stimmt
Die Zufallsvariable X muss so definiert werden, dass sie von den zu überprüfenden Hypothesen abhängt. Zudem muss noch die Verteilung angegeben werden (die Verteilung deiner Skizze), also die Verteilung unter der Voraussetzung das  stimmt. In diesem Lernpfad und in den Schul- und Abituraufgaben ist die Zufallsvariable X immer binomialverteilt. Dennoch ist es wichtig, dass du es notierst, sonst musst du mit Punktabzug rechnen.

4. Schritt: Entscheidungsregel angeben
In diesem Schritt wird der Verwerfungsbereich für X angegeben. Der Verwerfungsbereich ist der Bereich, der in deiner Skizze markiert ist. Also der Bereich, in dem man aussagen kann, dass mit einer großen statistischen Sicherheit gesunken bzw. gestiegen ist. Für die Bestimmung des Intervalls wird ein kritischer Wert k ermittelt. Ab diesem Wert liegen signifikante Abweichung (nach links oder rechts) zu der definierten Nullhypothese vor. Bis bzw. ab diesem Wert k wird die Nullhypothese zum ersten Mal verworfen.

Hinweis zur Ermittlung des kritischen Werts k:

Linksseitiger Test:

Durch Erstellen einer Tabelle mit den kumulierten Wahrscheinlichkeiten für die Binomialverteilung kann der k Wert abgelesen werden, bei dem die kumulierte Wahrscheinlichkeit gerade noch so unter dem festgelegten Signifikanzniveau liegt. Dies ist der kritische Wert k, bis zu diesem Wert wird die Nullhypothese verworfen.

Rechtsseitiger Test:
Mindestwahrscheinlichkeiten werden über die Gegenwahrscheinlichkeit berechnet. Es folgt . Durch Umformen der Gleichung erhält man Durch Erstellen einer Tabelle mit den kumulierten Wahrscheinlichkeiten für die Binomialverteilung kann der k Wert abgelesen werden, bei dem die kumulierte Wahrscheinlichkeit zum ersten Mal über 1- liegt. Dies ist der kritische Wert k-1. Diesen Wert rechnet man dann noch plus 1 und erhält somit den kritischen Wert. Ab diesem kritischen Wert wird die Nullhypothese verworfen.

Liegt dagegen das Stichprobenergebnis im Verwerfungsbereich, so kann man unter der festgelegten Irrtumswahrscheinlichkeit (=Signifikanzniveau ) sagen, dass die Gegenhypothese gilt. Im restlichen Bereich ist keine Aussage möglich, da auch andere Verteilungen mit anderen Wahrscheinlichkeiten zu Grunde liegen könnten.

Versuche jetzt im Folgenden, eigenständig einen Signifikanztest durchzuführen! Hast du Probleme bei einzelnen Schritten, so lies dir die Informationen oben nochmal genau durch!


Übung 1

Eine Partei sieht den Klimawandel nicht als Bedrohung an. Diese Partei hat ihre Argumente gegen die Bedrohung des Klimawandels im Jahr 2019 in vielen Debatten ausführlich erläutert. Die Partei interessiert sich, ob daher der Anteil der Menschen, die den Klimawandel als Bedrohung ansehen im Vergleich zu 2019, wo der Wert bei 71% lag, gesunken ist. Sie beschließt in einer Umfrage zufällig 1000 Menschen zu befragen und das Ergebnis anschließend mit einem Signifikanztest zu beurteilen. Das Signifikanzniveau legen sie auf 5% fest. Führe einen passenden Signifikanztest durch.



Vorüberlegung: Skizze zeichnen

Skizziere die Binomialverteilung für den Fall, dass immer noch 71% der Menschen in Deutschland sich durch den Klimawandel bedroht fühlen.
Markiere in der Skizze den Bereich, in dem die Partei mit einer großen statistischen Sicherheit zeigen kann, dass der Anteil gesunken ist.
Um welche Art von Test handelt es sich?

NeuDrei.png

Die Partei hat die Vermutung, dass die bisherige Wahrscheinlichkeit gesunken ist, daher liegt ein linksseitiger Test vor.

1. Schritt: Wahl der Nullhypothese und der Gegenhypothese

Vermutet die Partei, dass gestiegen oder gesunken ist? Wähle dies als Gegenhypothese .
und

2. Schritt: Festlegen des Stichprobenumfangs n und des Signifikanzniveaus

n=1000 und Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle \alpha=5%}

3. Schritt: Definition der Zufallsvaraible X und angeben der Verteilung wenn stimmt

X ist die Anzahl der 1000 Befragten, die den Klimawandel als Bedrohung ansehen.

X ist -verteilt


4. Schritt: Entscheidungsregel angeben

Suche den kritischen Wert, für den die kumulierte Wahrscheinlichkeit gerade noch kleiner gleich 5% ist. Erstelle dafür eine Tabelle mit den kumulierten Wahrscheinlichkeiten in deinem Taschenrechner.(Hinweis: Bei den meisten Taschenrechnern gibst du dafür die Funktion binomcdf(1000, 0.71, X) ein.)

Linksseitiger TEST.png
Durch Ablesen der Tabelle erhalten wir den kritischen Wert 685. Bis zu diesem Wert lehnen wir die Nullhypothese ab. Es ergibt sich folgender Verwerfungsbereich:{0, ...685}

In der Umfrage kommt raus, dass sich 750 Menschen von den 1000 Befragten durch den Klimawandel bedroht fühlen. Was kann die Partei mit diesem Ergebnis aussagen?

Da das Ergebnis nicht im Verwerfungsbereich liegt, kann keine Aussage getroffen werden, da auch andere Verteilungen mit anderen Wahrscheinlichkeiten zu Grunde liegen könnten.


Übung 2

Eine Umweltgruppe will raus finden, ob durch die hohe Öffentlichkeit des Themas des Klimawandels 2019 unter anderem auch ausgelöst durch die Fridays For Future Demos der Anteil der Menschen in Deutschland, die den Klimawandel als Bedrohung ansehen im Vergleich zu 2019, wo der Wert bei 71% lag, gestiegen ist. Sie beschließt, in einer Umfrage zufällig 1000 Menschen zu befragen und das Ergebnis anschließend mit einem Signifikanztest zu beurteilen. Das Signifikanzniveau legen sie auf 5% fest. Führe einen passenden Signifikanztest durch.

Vorüberlegung : Skizze zeichnen

Skizziere die Binomialverteilung für den Fall, dass immer noch 71% der Menschen in Deutschland sich durch den Klimawandel bedroht fühlen. Markiere in der Skizze den Bereich, in dem die Umweltgruppe mit einer großen statistischen Sicherheit zeigen kann, dass der Anteil gestiegen ist.
Um welche Art von Test handelt es sich?

NeuVier.png

Da der Verwerfungsbereich im rechten Rand der Binomialverteilung liegt, handelt es sich um einen rechtsseitigen Test.

1. Schritt: Wahl der Nullhypothese und der Gegenhypothese

Vermutet die Umweltgruppe, dass gestiegen oder gesunken ist? Wähle dies als Gegenhypothese .
und

2. Schritt: Festlegen des Stichprobenumfangs n und des Signifikanzniveaus

n=10000 und Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle \alpha=5%}

3. Schritt: Definition der Zufallsvariable X und angeben der Verteilung wenn stimmt

X ist die Anzahl der 1000 Befragten, die den Klimawandel als Bedrohung ansehen.

X ist -verteilt

4. Schritt: Entscheidungsregel angeben

Gesucht ist der Wert, bei dem die kumulierte Wahrscheinlichkeit für X mindestens dem kritische Wert sein soll, und diese Wahrscheinlichkeit soll kleiner gleich 5% sein.(Hinweis: Die Tabelle für die kumulierten Wahrscheinlichkeit erstellst du mit den meisten Taschenrechner über die Funktion binomcdf(1000, 0.71, X))
Erinnere dich daran, wie du Mindestwahrscheinlichkeiten berechnen kannst.

Unbenannt.png
Mindestwahrscheinlichkeiten werden über die Gegenwahrscheinlichkeit berechnet, es folgt . Durch Umformen der Gleichung erhält man . Man liest also den Wert ab, bei dem die kumulierte Wahrscheinlichkeit zum ersten mal größer gleich 0,95 ist. In diesem Fall 733. Da dies der kritische Wert minus 1 ist, rechnet man noch plus 1 und erhält somit den kritischen Wert, in dem Fall 734. Es ergibt sich folgender Verwerfungsbereiche: {734,...1000}.

In der Umfrage kommt raus, dass sich 748 Menschen von den 1000 Befragten sich durch den Klimawandel bedroht fühlen. Wie können die Schüler*innen dieses Ergebnis interpretieren?

Da das Ergebnis im Verwerfungsbereich liegt, kann mit einer Irrtumswahrscheinlichkeit von 5% davon ausgegangen werden, dass der Anteil der Menschen, die den Klimawandel als Bedrohung ansehen im Vergleich zu 2019 gestiegen ist.

Zweiseitiger Signifikanztest:
Neben dem links- und rechtsseitigen Test gibt es auch noch den zweiseitigen Test. Bei dieser Art des Tests will der Auftragsgeber zeigen, dass eine Aussage falsch ist. Der Auftragsgeber weiß allerdings noch nicht, ob der tatsächliche Wert nach links oder rechts abweicht. Die Durchführung des Tests erfolgt sehr ähnlich zum links- und rechtsseitigen Test, aber mit folgenden Unterschieden:
1.) Die Gegenhypothese ist die Gegenaussage zur Nullhypothese .
2.) Das Signifikanzniveau wird halbiert und auf beide Ränder der Binomialverteilung aufgeteilt . Der Verwerfungsbereich besteht somit aus der Vereinigung von zwei Intervallen.


Führe in der nächsten Übung einen zweiseitigen Signifikanztest durch.


Übung 3

2019 wurde veröffentlicht, dass sich 71% der Menschen in Deutschland durch den Klimawandel bedroht fühlen. Journalisten einer Zeitung hinterfragen diesen Wert. Sie wollen also diesen Wert mit einem zweiseitigen Signifikanztest überprüfen. Ihnen geht es hierbei nur um den Wahrheitsgehalt, aber nicht ob der Wert größer oder kleiner ist. Sie beschließt zufällig 1000 Menschen zu befragen. Das Signifikanzniveau legen sie auf 10% fest. Führe den zweiseitigen Signifikanztest durch.

Vorüberlegung : Skizze zeichnen

Skizziere die Binomialverteilung für den Fall, dass immer noch 71% der Menschen in Deutschland sich durch den Klimawandel bedroht fühlen. Markiere in der Skizze den Bereich rot, indem die Journalisten mit einer großen statistischen Sicherheit zeigen können, dass der Anteil gestiegen bzw. gesunken ist.
Um welche Art von Test handelt es sich?

Zweiseitigertest.png

Da der Verwerfungsbereich an beiden Rändern der Binomialverteilung liegt, handelt es sich um einen zweiseitigen Test.

1. Schritt: Wahl der Nullhypothese und der Gegenhypothese

Lies dir die Informationen zu dem zweiseitigen Test nochmal durch.
und

2. Schritt: Festlegen des Stichprobenumfangs n und des Signifikanzniveaus

n=1000 und Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle \alpha=10%}

3. Schritt: Definition der Zufallsvariable X und angeben der Verteilung wenn stimmt

X ist die Anzahl der 1000 Befragten, die den Klimawandel als Bedrohung ansehen.

X ist -verteilt

4. Schritt: Entscheidungsregel angeben

Berechne zwei kritische Werte analog zum links- und rechtsseitigen Test. Teile dafür das festgelegte Signifikanzniveau auf beide Ränder auf.

1.) Aus Ablesen in der Tabelle erhält man den kritischen Wert 685.
2.) Aus Ablesen in der Tabelle erhält man den kritischen Wert 734.

Somit ergibt sich folgender Verwerfungsbereich: Verwerfungsbereich: {0,..685}{734, ..., 1000}.

In der Umfrage kommt raus, dass sich 745 Menschen von den 1000 Befragten sich durch den Klimawandel bedroht fühlen. Wie können die Journalisten dieses Ergebnis interpretieren?

Da das Ergebnis im Verwerfungsbereich liegt, kann mit einer großen statistischen Sicherheit gesagt werden, dass der Anteil, der Menschen, die den Klimawandel als Bedrohung sehen, im Vergleich zu 2019 gestiegen ist.