Signifikanztest für binomialverteilte Zufallsgrößen/Aufbau und Durchführung eines Signifikanztests: Unterschied zwischen den Versionen

Aus ZUM-Unterrichten
(Schritt 1 umformuliert)
Markierung: 2017-Quelltext-Bearbeitung
K (Schritt 2 und Schritt 3 leicht umformuliert)
Markierung: 2017-Quelltext-Bearbeitung
Zeile 28: Zeile 28:
<div class="lueckentext-quiz">
<div class="lueckentext-quiz">
'''1. Schritt: Wahl der Nullhypothese <math>H_0</math> und der Gegenhypothese '''<br>
'''1. Schritt: Wahl der Nullhypothese <math>H_0</math> und der Gegenhypothese '''<br>
Die Nullhypothese <math>H_0</math> beschreibt die Wahrscheinlichkeit, die bisher für die Grundgesamtheit galt <math>H_0:p=p_0</math>. Durch bestimmte Einflüsse wird vermutet, dass <math>p_0</math> gesunken bzw. gestiegen ist. Diese Vermutung wird durch die Gegenhypothese <math>H_1</math> ausgedrückt.<math>H_1</math> lautet also entweder <math>H_1:p<p_0</math> bzw. <math>H_1:p>p_0</math> Das Ziel des Signifikanztests ist es, die Nullhypothese <math>H_0</math> zu verwerfen. Wird die Nullhypothese verworfen, so ist mit einer großen statistischen Sicherheit gezeigt, dass die Gegenhypothese <math>H_1</math> gilt.  
Die Nullhypothese <math>H_0</math> beschreibt die Wahrscheinlichkeit, die bisher für die Grundgesamtheit galt <math>H_0:p=p_0</math>. Durch bestimmte Einflüsse wird vermutet, dass <math>p_0</math> gesunken bzw. gestiegen ist. Diese Vermutung wird durch die Gegenhypothese <math>H_1</math> ausgedrückt.<math>H_1</math> lautet also entweder <math>H_1:p<p_0</math> bzw. <math>H_1:p>p_0</math>. Das Ziel des Signifikanztests ist es, die Nullhypothese <math>H_0</math> zu verwerfen. Wird die Nullhypothese verworfen, so ist mit einer großen statistischen Sicherheit gezeigt, dass die Gegenhypothese <math>H_1</math> gilt.  
</div>
</div>


Zeile 40: Zeile 40:
}}
}}


<div class="lueckentext-quiz">
'''2. Schritt: Festlegen des Stichprobenumfangs n und des Signifikanzniveaus <math>\alpha</math>'''<br>
'''2. Schritt: Festlegen des Stichprobenumfangs n und des Signifikanzniveaus <math>\alpha</math>'''<br>
Der Stichprobenumfang n und das Signifikanzniveau <math>\alpha</math> sind meistens in der Aufgabenstellung angegeben. Diese Größen musst du also einfach nur aus dem Aufgabentext rausschreiben. Das Signifikanzniveau <math>\alpha</math> legt die maximale Irrtumswahrscheinlichkeit fest, eine Nullhypothese <math>H_0</math> fälschlicherweise zu verwerfen. Die Höhe des Signifikanzniveaus <math>\alpha</math> legt der Auftragsgeber vor der Durchführung des Tests fest. Ein üblicher Wert ist <math>\alpha=5%</math>, manchmal wird aber auch ein strenges Niveau von <math>\alpha=1%</math> gewählt. <br><br>
Der Stichprobenumfang n und das Signifikanzniveau <math>\alpha</math> sind meistens in der Aufgabenstellung angegeben. Diese Größen musst du also einfach nur aus dem Aufgabentext rausschreiben. Das Signifikanzniveau <math>\alpha</math> legt die maximale Irrtumswahrscheinlichkeit fest, eine Nullhypothese <math>H_0</math> fälschlicherweise zu verwerfen. Die Höhe des Signifikanzniveaus <math>\alpha</math> legt der Auftragsgeber vor der Durchführung des Tests fest. Ein üblicher Wert ist <math>\alpha=5%</math>, manchmal wird aber auch ein strenges Niveau von <math>\alpha=1%</math> gewählt. <br><br>
</div>


Beispiel:<br>
Beispiel:<br>
Zeile 49: Zeile 51:
}}
}}


<div class="lueckentext-quiz">
'''3. Schritt: Definition der Zufallsvariable X und angeben der Verteilung wenn <math>H_0</math> stimmt'''<br>
Die Zufallsvariable X muss so gewählt werden, dass sie von den zu überprüfenden Hypothesen abhängt. Zudem muss noch die Verteilung angegeben werden (die Verteilung deiner Skizze),  also die Verteilung unter der Voraussetzung das  <math>H_0</math> stimmt. In diesem Lernpfad und in den Schul- und Abituraufgaben ist die Zufallsvariable X immer  binomialverteilt. Dennoch ist es wichtig, dass du es notierst, sonst musst du mit Punktabzug rechnen. <br><br>
</div>


'''3. Schritt: Definition der Zufallsvariable X und angeben der Verteilung wenn <math>H_0</math> stimmt'''<br>
Die Zufallsvariable X muss so gewählt werden, dass sie von den zu überprüfenden Hypothesen abhängt. Zudem muss noch die Verteilung angegeben werden (die Verteilung deiner Skizze),  also die Verteilung unter der Voraussetzung das der Grenzfall von <math>H_0</math> stimmt. In diesem Lernpfad und in den Schul- und Abituraufgaben ist die Zufallsvariable X immer  binomialverteilt. Dennoch ist es wichtig, dass du es notierst, sonst musst du mit Punktabzug rechnen. <br><br>


Beispiel:<br>
Beispiel:<br>
Zeile 58: Zeile 62:
{{Lösung versteckt|1=
{{Lösung versteckt|1=
X ist die Anzahl der 1000 Befragten, die den Klimawandel als Bedrohung ansehen.<br>
X ist die Anzahl der 1000 Befragten, die den Klimawandel als Bedrohung ansehen.<br>
X ist im Grenzfall <math>B_{1000,0.71}</math> -verteilt
X ist <math>B_{1000,0.71}</math> -verteilt
}}
}}



Version vom 5. März 2020, 09:52 Uhr


Die Grundidee vom Signifikanztest hast du bereits verstanden. Auf dieser Seite lernst du nun den Aufbau und die Begrifflichkeiten eines Signifikanztests kennen.

Ein Signifikanztest besteht aus vier Schritten.

Vorüberlegung und Schritte .png

Im Folgenden werden die einzelnen Schritte ausführlich beschrieben. Nach der Beschreibung, werden die jeweiligen Schritte zum folgenden Beispiel durchgeführt. Versuche das Beispiel erst eigenständig zu lösen und lasse dir erst zur Kontrolle die Lösung anzeigen.

Beispiel:
Eine Partei sieht den Klimawandel nicht als Bedrohung an. Diese Partei hat ihre Argumente gegen die Bedrohung des Klimawandels im Jahr 2019 in vielen Debatten ausführlich erläutert. Die Partei interessiert sich, ob daher der Anteil der Menschen, die den Klimawandel als Bedrohung ansehen im Vergleich zu 2019 (2019 lag der Wert bei 71%) gesunken ist. Sie beschließt in einer Umfrage zufällig 1000 Menschen zu befragen und das Ergebnis anschließend mit einem Signifikanztest zu beurteilen. Das Signifikanzniveau legen sie auf 5% fest. Führe einen passenden Signifikanztest durch.

Vorüberlegung:
Skizziere die Binomialverteilung für die Stichprobe mit der bisher geltenden bzw. angenommene Wahrscheinlichkeit . Kläre die Frage, ob durch bestimmte Einflüsse vermutet wird, dass die bisherige Wahrscheinlichkeit gesunken bzw. gestiegen ist. Falls die Vermutung vorliegt, dass die Wahrscheinlichkeit gesunken ist, liegt ein linksseitiger Test vor, so markiere den linken Rand der Binomialverteilung. Liegt der Verdacht vor, dass die Wahrscheinlichkeit gestiegen ist, so handelt es sich um ein rechtsseitiger Test und es ist der rechte Rand der Veteilung zu markieren.

Beispiel:
Vorüberlegung: Skizze zeichnen

Skizziere die Binomialverteilung für den Fall, dass immer noch 71% der Menschen in Deutschland sich durch den Klimawandel bedroht fühlen.
Um welche Art von Test handelt es sich?

NeuDrei.png

Die Partei hat die Vermutung, dass die bisherige Wahrscheinlichkeit gesunken ist, daher liegt ein linksseitiger Test vor.

1. Schritt: Wahl der Nullhypothese  und der Gegenhypothese
Die Nullhypothese beschreibt die Wahrscheinlichkeit, die bisher für die Grundgesamtheit galt . Durch bestimmte Einflüsse wird vermutet, dass gesunken bzw. gestiegen ist. Diese Vermutung wird durch die Gegenhypothese ausgedrückt. lautet also entweder bzw. . Das Ziel des Signifikanztests ist es, die Nullhypothese zu verwerfen. Wird die Nullhypothese verworfen, so ist mit einer großen statistischen Sicherheit gezeigt, dass die Gegenhypothese gilt.


Beispiel:
1. Schritt: Wahl der Nullhypothese und der Gegenhypothese

Vermutet die Partei, dass gestiegen oder gesunken ist? Wähle dies als Gegenhypothese .
und

2. Schritt: Festlegen des Stichprobenumfangs n und des Signifikanzniveaus
Der Stichprobenumfang n und das Signifikanzniveau sind meistens in der Aufgabenstellung angegeben. Diese Größen musst du also einfach nur aus dem Aufgabentext rausschreiben. Das Signifikanzniveau legt die maximale Irrtumswahrscheinlichkeit fest, eine Nullhypothese fälschlicherweise zu verwerfen. Die Höhe des Signifikanzniveaus legt der Auftragsgeber vor der Durchführung des Tests fest. Ein üblicher Wert ist Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle \alpha=5%} , manchmal wird aber auch ein strenges Niveau von Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle \alpha=1%} gewählt.

Beispiel:
2. Schritt: Festlegen des Stichprobenumfangs n und des Signifikanzniveaus

n=1000 und Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle \alpha=5%}

3. Schritt: Definition der Zufallsvariable X und angeben der Verteilung wenn  stimmt
Die Zufallsvariable X muss so gewählt werden, dass sie von den zu überprüfenden Hypothesen abhängt. Zudem muss noch die Verteilung angegeben werden (die Verteilung deiner Skizze), also die Verteilung unter der Voraussetzung das  stimmt. In diesem Lernpfad und in den Schul- und Abituraufgaben ist die Zufallsvariable X immer binomialverteilt. Dennoch ist es wichtig, dass du es notierst, sonst musst du mit Punktabzug rechnen.


Beispiel:

3. Schritt: Definition der Zufallsvaraible X und angeben der Verteilung wenn stimmt

X ist die Anzahl der 1000 Befragten, die den Klimawandel als Bedrohung ansehen.

X ist -verteilt

4. Schritt: Entscheidungsregel angeben
In diesem Schritt werden die Intervalle für den Annahme- und Verwerfungsbereich für X angegeben. Der Verwerfungsbereich ist der Bereich, der in deiner Skizze rot markiert ist. Also der Bereich, in dem man aussagen kann, dass mit einer großen statistischen Sicherheit gesunken bzw. gestiegen ist. Der Annahmebereich ist der restliche Bereich, in diesem Intervall kann man keine Aussage treffen, da auch andere Verteilungen mit anderen Wahrscheinlichkeiten zu Grunde liegen könnten. Für die Bestimmung der Intervalle wird ein kritischer Wert ermittelt. Ab diesem Wert liegen signifikante Abweichung (nach links oder rechts) zu der in definierten Nullhypothese vor. Ab diesem Wert wird die Nullhypothese zum ersten mal verworfen.

Hinweis zur Ermittlung des kritischen Werts:

Linksseitiger Test:

Durch Erstellen einer Tabelle mit den kumulierten Wahrscheinlichkeiten für die Binomialverteilung kann der k Wert abgelesen werden bei dem die kumulierte Wahrscheinlichkeit gerade noch so unter dem festgelegten Signifikanzniveau liegt. Dies ist der kritische Wert kr, bis zu diesem Wert wird die Nullhypothese verworfen.

Rechtsseitiger Test:
Mindestwahrscheinlichkeiten werden über die Gegenwahrscheinlichkeit berechnet. Es folgt . Durch Umformen der Gleichung erhält man Durch Erstellen einer Tabelle mit den kumulierten Wahrscheinlichkeiten für die Binomialverteilung kann der k Wert abgelesen werden, bei dem die kumulierte Wahrscheinlichkeit zum ersten Mal über 1- liegt. Dies ist der kritische Wert kr -1. Diesen Wert rechnet man dann noch plus 1 und erhält somit den kritischen Wert. Ab diesem kritischen Wert wird die Nullhypothese verworfen.

Beispiel:
4. Schritt: Entscheidungsregel angeben

(Erinnerung: Es handelt es sich um einen linksseitigen Test) Suche den kritischen Wert, für den die kumulierte Wahrscheinlichkeit gerade noch kleiner gleich 5% ist. Erstelle dafür eine Tabelle mit den kumulierten Wahrscheinlichkeiten in deinem Taschenrechner.(Hinweis: Bei den meisten Taschenrechnern gibst du dafür die Funktion binomcdf(1000, 0.71, X) ein.)

Linksseitiger TEST.png
Durch Ablesen der Tabelle erhalten wir den kritischen Wert 685. Bis zu diesem Wert lehnen wir die Nullhypothese ab. Es ergeben sich folgende Annahme- und Verwerfungsbereich: Annahmebereich:{686, ..., 1000}, Verwerfungsbereich:{0, ...685}


Liegt das Ergebnis der Stichprobe im Annahmebereich, so ist keine Aussage möglich, da auch Verteilungen mit anderen Wahrscheinlichkeiten zu Grunde liegen könnten. Liegt dagegen das Stichprobenergebnis im Verwerfungsbereich, so kann man unter der festgelegten Irrtumswahrscheinlichkeit (=Signifikanzniveau ) sagen, dass die Gegenhypothese gilt.

Beispiel:
In der Umfrage kommt raus, dass sich 750 Menschen von den 1000 Befragten durch den Klimawandel bedroht fühlen. Was kann die Partei mit diesem Ergebnis aussagen?

Da das Ergebnis im Annahmebereich liegt, kann keine Aussage getroffen werden, da auch andere Verteilungen mit anderen Wahrscheinlichkeiten zu Grunde liegen könnten.


Versuche jetzt im Folgenden, eigenständig einen Signifikanztest durchzuführen! Hast du Probleme bei einzelnen Schritten, so lies dir die Informationen oben nochmal genau durch!


Übung 1

Eine Umweltgruppe will raus finden, ob durch die hohe Öffentlichkeit des Themas des Klimawandels 2019 unter anderem auch ausgelöst durch die Fridays For Future Demos der Anteil der Menschen in Deutschland, die den Klimawandel als Bedrohung ansehen im Vergleich zu 2019, wo der Wert bei 71% lag, gestiegen ist. Sie beschließt, in einer Umfrage zufällig 1000 Menschen zu befragen und das Ergebnis anschließend mit einem Signifikanztest zu beurteilen. Das Signifikanzniveau legen sie auf 5% fest. Führe einen passenden Signifikanztest durch.

Vorüberlegung : Skizze zeichnen

Skizziere die Binomialverteilung für den Fall, dass immer noch 71% der Menschen in Deutschland sich durch den Klimawandel bedroht fühlen. Markiere in der Skizze den Bereich rot, in dem die Umweltgruppe mit einer großen statistischen Sicherheit zeigen kann, dass der Anteil gestiegen ist.
Um welche Art von Test handelt es sich?

NeuVier.png

Da der Verwerfungsbereich im rechten Rand der Binomialverteilung liegt, handelt es sich um einen rechtsseitigen Test.

1. Schritt: Wahl der Nullhypothese und der Gegenhypothese

Die Gegenhypothese ist immer so formuliert, dass sie den Interessen des Auftragsgebers entspricht. Die zugehörige Gegenaussage inklusive Grenzfall ist dann die entsprechende Nullhypothese
und

2. Schritt: Festlegen des Stichprobenumfangs n und des Signifikanzniveaus

n=10000 und Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle \alpha=5%}

3. Schritt: Definition der Zufallsvariable X und angeben der Verteilung wenn stimmt

X ist die Anzahl der 1000 Befragten, die den Klimawandel als Bedrohung ansehen.

X ist im Grenzfall -verteilt

4. Schritt: Entscheidungsregel angeben

Gesucht ist der Wert, bei dem die kumulierte Wahrscheinlichkeit für X mindestens der kritische Wert sein soll, und diese Wahrscheinlichkeit soll kleiner gleich 5% sein.(Hinweis: Die Tabelle für die kumulierten Wahrscheinlichkeit erstellst du mit den meisten Taschenrechner über die Funktion binomcdf(1000, 0.71, X))
Erinnere dich daran, wie du Mindestwahrscheinlichkeiten berechnen kannst.

Unbenannt.png
Mindestwahrscheinlichkeiten werden über die Gegenwahrscheinlichkeit berechnet, es folgt . Durch Umformen der Gleichung erhält man . Man liest also den Wert ab, bei dem die kumulierte Wahrscheinlichkeit zum ersten mal größer gleich 0,95 ist. In diesem Fall 733. Da dies der kritische Wert minus 1 ist, rechnet man noch plus 1 und erhält somit den kritischen Wert, in dem Fall 734. Es ergeben sich folgende Annahme- und Verwerfungsbereiche: Annahmebereich {0,...,733}, Verwerfungsbereich {734,...1000}

In der Umfrage kommt raus, dass sich 748 Menschen von den 1000 Befragten sich durch den Klimawandel bedroht fühlen. Wie können die Schüler*innen dieses Ergebnis interpretieren?

Da das Ergebnis im Verwerfungsbereich liegt, kann mit einer Irrtumswahrscheinlichkeit von 5% davon ausgegangen werden, dass der Anteil der Menschen, die den Klimawandel als Bedrohung ansehen im Vergleich zu 2019 gestiegen ist.

Zweiseitiger Signifikanztest:
Neben dem links- und rechtsseitigen Test gibt es auch noch den zweiseitigen Test. Bei dieser Art des Tests will der Auftragsgeber zeigen, dass eine Aussage falsch ist. Der Auftragsgeber weiß allerdings noch nicht, ob der tatsächliche Wert nach links oder rechts abweicht. Die Durchführung des Tests erfolgt sehr ähnlich zum links- und rechtsseitigen Test, aber mit folgenden Unterschieden:
1.) Die Nullhypothese wird nicht als Intervall formuliert, sondern als Punkt( bisher geltende bzw. angenommene Wahrscheinlichkeit). Die Gegenhypothese ist entsprechend die Gegenaussage ( bisher geltende Wahrscheinlichkeit).
2.) Das Signifikanzniveau wird halbiert und auf beide Ränder der Binomialverteilung aufgeteilt . Der Verwerfungsbereich besteht somit aus der Vereinigung von zwei Intervallen.


Führe in der nächsten Übung einen zweiseitigen Signifikanztest durch.


Übung 2

2019 wurde veröffentlicht, dass sich 71% der Menschen in Deutschland durch den Klimawandel bedroht fühlen. Journalisten einer Zeitung hinterfragen diesen Wert. Sie wollen also diesen Wert mit einem zweiseitigen Signifikanztest überprüfen. Ihnen geht es hierbei nur um den Wahrheitsgehalt, aber nicht ob der Wert größer oder kleiner ist. Sie beschließt zufällig 1000 Menschen zu befragen. Das Signifikanzniveau legen sie auf 10% fest. Führe den zweiseitigen Signifikanztest durch.

Vorüberlegung : Skizze zeichnen

Skizziere die Binomialverteilung für den Fall, dass immer noch 71% der Menschen in Deutschland sich durch den Klimawandel bedroht fühlen. Markiere in der Skizze den Bereich rot, indem die Journalisten mit einer großen statistischen Sicherheit zeigen können, dass der Anteil gestiegen bzw. gesunken ist.
Um welche Art von Test handelt es sich?

Zweiseitigertest.png

Da der Verwerfungsbereich an beiden Rändern der Binomialverteilung liegt, handelt es sich um einen zweiseitigen Test.

1. Schritt: Wahl der Nullhypothese und der Gegenhypothese

Lies dir die Informationen zu dem zweiseitigen Test nochmal durch.
und

2. Schritt: Festlegen des Stichprobenumfangs n und des Signifikanzniveaus

n=1000 und Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „[INVALID]“): {\displaystyle \alpha=10%}

3. Schritt: Definition der Zufallsvariable X und angeben der Verteilung wenn stimmt

X ist die Anzahl der 1000 Befragten, die den Klimawandel als Bedrohung ansehen.

X ist -verteilt

4. Schritt: Entscheidungsregel angeben

Berechne zwei kritische Werte analog zum links- und rechtsseitigen Test. Teile dafür das festgelegte Signifikanzniveau auf beide Ränder auf.

1.) Aus Ablesen in der Tabelle erhält man den kritischen Wert 685.
2.) Aus Ablesen in der Tabelle erhält man den kritischen Wert 734.

Somit ergibt sich folgender Annahme- und Verwerfungsbereich: Annahmebereich: {686, ..., 733}, Verwerfungsbereich: {0,..685}{734, ..., 1000}.

In der Umfrage kommt raus, dass sich 745 Menschen von den 1000 Befragten sich durch den Klimawandel bedroht fühlen. Wie können die Journalisten dieses Ergebnis interpretieren?

Da das Ergebnis im Verwerfungsbereich liegt, kann mit einer großen statistischen Sicherheit gesagt werden, dass der Anteil, der Menschen, die den Klimawandel als Bedrohung sehen, im Vergleich zu 2019 gestiegen ist.