Statistiken1: Unterschied zwischen den Versionen

Aus ZUM-Unterrichten
Keine Bearbeitungszusammenfassung
(21 dazwischenliegende Versionen von 2 Benutzern werden nicht angezeigt)
Zeile 15: Zeile 15:


* [https://www.urban.org/events/alberto-cairo-misleading-data-and-visualizations Alberto Cairo on Misleading Data and Visualizations] (Vortragsaufzeichnung "Visual Trumpery. How to fight against fake data and visualizations - from the left and from the right).
* [https://www.urban.org/events/alberto-cairo-misleading-data-and-visualizations Alberto Cairo on Misleading Data and Visualizations] (Vortragsaufzeichnung "Visual Trumpery. How to fight against fake data and visualizations - from the left and from the right).
* [https://www.dropbox.com/scl/fo/9ypoz3u88erufvqxlyn4n/ANEpDgRJ-EItwoSRmDwvaqo?rlkey=vy6r90qipyn6keurj3t2pj0n1&e=2&dl=0 Alberto Cairo: TrumperyReadings] (frei verfügbare Unterlagen auf dropbox)


== '''Grundlagen''' ==
== '''Grundlagen''' ==
Zeile 49: Zeile 48:
Die Berichterstattung in den Medien bedient sich ebenfalls häufig grafischer Darstellungen von Daten, um wichtige Aussagen leichter verständlich zu machen.
Die Berichterstattung in den Medien bedient sich ebenfalls häufig grafischer Darstellungen von Daten, um wichtige Aussagen leichter verständlich zu machen.
|
|
[[Datei:VerfallsdatumWaffen.png|mini|Grafik 5: Bildschirmaufnahme einer Infografik zum Verfallsdatum von Waffen der Schweizer Armee (Quelle: [https://www.derbund.ch/nicht-nur-jets-die-schweiz-muss-fast-alle-waffensysteme-ersetzen-645122316025 Der Bund])]]
[[Datei:ArmeeBudget.jpg|mini|Grafik 5: Fotografie einer Infografik zum Verfallsdatum von Waffen der Schweizer Armee (Quelle: [https://www.derbund.ch/nicht-nur-jets-die-schweiz-muss-fast-alle-waffensysteme-ersetzen-645122316025 Der Bund])]]
}}
}}
<br />
<br />
Zeile 75: Zeile 74:
Um die Grafiken lesen und verstehen zu können, müssen wir die verwendeten ''Symbole'' und die ''Abbildungsregeln'' kennen  (vergleichbar mit den Buchstaben und den zur Wort- und Satzbildung benötigten Regeln, die wir kennen müssen, um Texte verstehen zu können).</big>|Hervorhebung1
Um die Grafiken lesen und verstehen zu können, müssen wir die verwendeten ''Symbole'' und die ''Abbildungsregeln'' kennen  (vergleichbar mit den Buchstaben und den zur Wort- und Satzbildung benötigten Regeln, die wir kennen müssen, um Texte verstehen zu können).</big>|Hervorhebung1
}}
}}
<br/>
<br/>Beispielsweise repräsentieren in der Wetterprognose-Grafik (Grafik 1) die Grösse des Symbols der Sonne und die Grösse des Wolkensymbols die Wetterlagen "sonnig/wolkenlos", "leicht bewölkt" und "wolkig/stark bewölkt".
Beispielsweise repräsentieren in der Wetterprognose-Grafik (Grafik 1) die Grösse des Symbols der Sonne und die Grösse des Wolkensymbol die Wetterlagen "sonnig/wolkenlos", "leicht bewölkt" und "wolkig/stak bewölkt".
 
Beispielsweise repräsentieren in der Wetterprognose-Grafik (Grafik 1) die Grösse des Symbols der Sonne und die Grösse des Wolkensymbol die Wetterlagen "sonnig/wolkenlos", "leicht bewölkt" und "wolkig/stak bewölkt".


In der Grafik 2 ist die Niederschlagsmenge auf das Symbol "Säule" abgebildet. Die Länge der Säule repräsentiert den Wert der Niederschlagsmenge. Die Länge der senkrechten (vertikalen) Strecke repräsentiert die Unsicherheit der Prognose, dh. die maximale und die minimale zu erwartende Niederschlagsmenge.
In der Grafik 2 ist die Niederschlagsmenge auf das Symbol "Säule" abgebildet. Die Länge der Säule repräsentiert den Wert der Niederschlagsmenge. Die Länge der senkrechten (vertikalen) Strecke repräsentiert die Unsicherheit der Prognose, dh. die maximale und die minimale zu erwartende Niederschlagsmenge.
Zeile 193: Zeile 189:


=== Verzerrungen und Fehler erkennen ===
=== Verzerrungen und Fehler erkennen ===
<br/>
Leseempfehlung: Wolfgang Walla: [https://www.statistischebibliothek.de/mir/servlets/MCRFileNodeServlet/BWMonografie_derivate_00000082/8020_08001.pdf Wie man sich durch statistische Grafiken täuschen lässt]. Statistisches Landesamt Baden-Württemberg, 2008.
==== "Rosinen pflücken" (cherry-picking) ====
'''Praxis-Beispiel''': Covid-19 Daten (aus [https://vdl.sci.utah.edu/blog/2023/04/17/misleading/ Maxim Lisnic: How People Actually Lie With Charts])
[[Datei:Visualisierung mit Beschränkung auf einen Ausschnitt.png|mini|center]]
[[Datei:Corona-Daten-USA-1.png|mini|center|Quelle: https://coronavirus.jhu.edu/region/united-states]]
==== Absolute und relative Datenwerte ====
==== Skalierung der Datenwerte beginnt nicht bei 0 ====
Um den Unterschied zwischen zwei (oder mehreren) Datenwerten grösser erscheinen zu lassen als er tatsächlich ist, wird die Skala der Datenwerte oft "beschnitten", d.h. sie beginnt nicht bei 0.
{{2Spalten
|
[[Datei:SkalaDerDatenwerteBeginntNichtBeiNull.png|mini|center|Die Skala der Datenwerte beginnt bei 1400]]
|
[[Datei:SkalaDerDatenwerteBeginntBeiNull.png|mini|center|Die Skala der Datenwerte beginnt bei 0]]
}}
'''Praxis-Beispiel''': Infografik zur Abstimmung über die Reform der beruflichen Vorsorge vom 22.09.2024 (Schweiz) im [https://www.ktipp.ch/fileadmin/content/magazine/ktipp/2024/14/PDF/01-08-KT-1324-PKspezial-LOW.pdf K-Tipp vom 27.08.2024]
[[Datei:BVG-Renten-2.jpg|mini|center]]
Heikel ist in diesem Fall auch die Verwendung eines einzelnen, ausgewählten Beispiels, um die allgemeine Aussage zu veranschaulichen.
=== Logarithmische versus lineare Skalen ===
'''Praxis-Beispiel''': Covid-19 Daten (aus [https://behavioralpolicy.org/wp-content/uploads/2021/01/BSP-Journal_Special-Online-Covid_Ryan-Evers_2nd-2024 William H. Ryan & Ellen R. K. Evers: Graphs with logarithmic axes distort lay judgments])
[[Datei:Logarithmische versus lineare Darstellung gleicher Daten.png|mini|center]]


=== Kausalität oder nur Korrelation? (Ursache und Wirkung oder nur Ähnlichkeit?)===
=== Kausalität oder nur Korrelation? (Ursache und Wirkung oder nur Ähnlichkeit?)===
Zeile 199: Zeile 231:
Programme: z.B. https://www.rawgraphs.io, https://www.datawrapper.de/
Programme: z.B. https://www.rawgraphs.io, https://www.datawrapper.de/
----
----
Autor: [[Benutzer:WenkBruno|Bruno Wenk]]
 
 
{{Autorenbox}}

Version vom 19. November 2024, 13:54 Uhr

Infografiken lesen und verstehen

work in progress!

Einleitung

Wissenschaftliche Erkenntnisse und Entscheide in Politik und Wirtschaft gründen in der Regel auf statistischen Auswertungen von Studien, Umfragen, Messungen oder Analysen. Zeitungen und Zeitschriften, Webseiten und Lehrbücher bringen uns die Ergebnisse in der Folge mit grafischen Darstellungen, sogenannten Infografiken, nahe.

Infografiken stellen komplexe Sachverhalte anschaulich dar. Sie sind meist farbig und machen Eindruck. Aber Achtung: Nicht alle Infografiken sind leicht verständlich! Manche liefern ein verzerrtes Bild der Sachverhalte. Hin und wieder sind die Grafiken – absichtlich oder unabsichtlich – sogar falsch, und bei neuartigen Visualisierungen fehlt uns vielleicht die Erfahrung, sie verstehen und als Grundlage für unsere Meinungsbildung nutzen zu können.

Kompetenz im Umgang mit Information und Daten ist nötig, um am gesellschaftlichen und politischen Dialog aktiv teilnehmen zu können. Auch in Unternehmen sind Informations- und Datenkompetenz unabdingbar. Dazu gehört die Fähigkeit, grafische Darstellungen von Daten (Infografiken) lesen und verstehen zu können.

Mehr zu Thema:

Grundlagen

Infografiken im Alltag


Daten beschreiben Sachverhalte und / oder Zusammenhänge. Infografiken stellen Daten anschaulich dar, indem sie diese auf Symbole und deren Merkmale abbilden.


Grafische Darstellungen von Wetterdaten sind wohl die bekanntesten Beispiele von Infografiken im Alltag.

(zum Vergrössern der Bilder auf das Lupen-Symbol klicken)

Grafik 1: Bildschirmaufnahme von https://kachelmannwetter.com
Grafik 1: Bildschirmaufnahme von https://kachelmannwetter.com
Grafik 2: Bildschirmaufnahme von https://kachelmannwetter.com
Grafik 2: Bildschirmaufnahme von https://kachelmannwetter.com
Grafik 3: Bildschirmaufnahme einer Wetterkarte des Deutschen Wetterdienstes


Besonders eindrücklich sind interaktive Visualisierungen.

Grafik 4: Bildschirmaufnahme von https://www.landi.ch/wetter/niederschlagsradar


Die Berichterstattung in den Medien bedient sich ebenfalls häufig grafischer Darstellungen von Daten, um wichtige Aussagen leichter verständlich zu machen.

Grafik 5: Fotografie einer Infografik zum Verfallsdatum von Waffen der Schweizer Armee (Quelle: Der Bund)


Statistische Ämter publizieren laufend Infografiken zuhanden der Bevölkerung, um die Ergebnisse von Erhebungen und Analysen anschaulich darzustellen.

Grafik 6: Bildschirmaufnahme einer Infografik zum verfügbaren Einkommen Schweizer Haushalte (Quelle: Bundesamt für Statistik BfS)


Auch in der Wissenschaftskommunikation spielen Infografiken eine Rolle, um komplexe wissenschaftliche Zusammenhänge durch Visualisierungen und grafische Aufarbeitung verständlich zu machen.

Grafik 7: Bildschirmaufnahme einer Grafik zu der Anzahl wiss. Publikationen in verschiedenen Ländern (Quelle: Datenportal BMBF)


Daten und deren Werte, Symbole und deren Merkmale, Legenden


In einer Infografik sind die interessierenden Daten auf Symbole abgebildet. Die unterschiedlichen Merkmale der Symbole repräsentieren die Art und den Wert der dargestellten Daten.

Um die Grafiken lesen und verstehen zu können, müssen wir die verwendeten Symbole und die Abbildungsregeln kennen (vergleichbar mit den Buchstaben und den zur Wort- und Satzbildung benötigten Regeln, die wir kennen müssen, um Texte verstehen zu können).


Beispielsweise repräsentieren in der Wetterprognose-Grafik (Grafik 1) die Grösse des Symbols der Sonne und die Grösse des Wolkensymbols die Wetterlagen "sonnig/wolkenlos", "leicht bewölkt" und "wolkig/stark bewölkt".

In der Grafik 2 ist die Niederschlagsmenge auf das Symbol "Säule" abgebildet. Die Länge der Säule repräsentiert den Wert der Niederschlagsmenge. Die Länge der senkrechten (vertikalen) Strecke repräsentiert die Unsicherheit der Prognose, dh. die maximale und die minimale zu erwartende Niederschlagsmenge.

Die in grafischen Darstellungen von Wetterdaten (Grafik 1) verwendeten Symbole sind uns vertraut: Sonne, Wolken, Regenschirm, usw. Auch Symbole wie die Säulen in Grafik 2 verstehen wir ohne Weiteres. Trotzdem hilft eine Erklärung der verwendeten Symbole (eine Legende), die jeweilige Infografik zu verstehen. Beispielsweise sind detailliertere Wetterkarten, die MeteorologInnen einen raschen Überblick über die allgemeine Wetterlage vermitteln (Grafik 3), für uns Laien nicht so leicht verständlich; wir benötigen die Legende, um uns mit den entsprechenden Symbolen vertraut machen zu können.

Legende mit den in Wetterkarten von kachelmannwetter.com (Grafik 1) verwendeten Symbole
Legende zur Grafik 3: Wettersymbole (Quelle: Wikipedia)


Reflexion 1-A
Welche Symbole erkennen Sie in den Grafiken 4 bis 7? Auf welche Merkmale der Symbole werden die betreffenden Daten abgebildet?

Musterantworten zur Reflexion 1-A


Aussagen und Interpretationen


Was eine Grafik aussagt, lässt sich durch eine Analyse der dargestellten Datenwerte ermitteln. Mit einer Interpretation der Grafik versucht man, der Bedeutung der Aussagen nachzuspüren.


Was die Grafik 1 über das Wetter aussagt, wird uns sofort klar: Am Donnerstag ist es voraussichtlich stärker bewölkt als am Dienstag und deutlich kälter, ausserdem muss mit Regenschauern gerechnet werden. Wir interpretieren die Aussagen dahingehend, dass wir am Donnerstag vielleicht doch eher ein Museum besuchen als eine Wanderung unternehmen sollten. Wir sind uns aber bewusst, dass sich das Wetter am Donnerstag nicht unbedingt an die Prognose halten wird ;-). Deshalb werfen wir in den kommenden Tagen immer wieder einen Blick auf die aktuelle Wetter-Grafik und schauen auch noch selbst zum Himmel, bevor wir uns definitiv entscheiden..

Welche Aussage(n) finden wir in der Grafik 5? Eine erste Antwort liefert der Titel: "Die Verfallsdaten der Waffen der Schweizer Armee". Aller Waffen? Nein, der Untertitel präzisiert: "... der wichtigsten Waffensysteme der Luftwaffe und des Heeres". Die Grafik veranschaulicht einen banalen Sachverhalt. Um diese Aussage zu vermitteln, würde eine Tabelle genügen.

Waffe im Einsatz seit Anzahl Verfallsdatum
Kampfjet F5 Tiger 1978 53 2020 / Q1
Flab-Lenkwaffe Rapier 1984 40 2020 / Q3
Fliegerradar Taflir   1987 5 2021 / Q3
35mm-Flab-Kanone 1963 24 2025 / Q1
usw.

Welche Interpretationen lässt diese Grafik zu? Die Schweizer Armee verfügt nicht mehr über genügend Waffen? Die Scheizer Armee hat es versäumt, das Waffenarsenal rechtzeitig zu erneuern?

Wir können nur spekulieren. Für eine Interpretation wären zusätzliche Daten nötig, z.B. über die geplanten, bewilligten und budgetierten Beschaffungen. Vielleicht liefert der Zeitungsartikel, dem die Grafik entnommen ist (Der Bund: "Nicht nur Jets – die Schweiz muss fast alle Waffensysteme ersetzen"), mehr Information? Der Text schafft Klarheit: Es geht um die Rüstungsbedürfnisse der Schweizer Militärs (2017). Den hohen Ansprüchen des Militärs steht die Ablehnung armeekritischer Gruppierungen gegenüber. Der Artikel ist ausgewogen, er lässt beide Seiten zu Wort kommen, und er setzt der einseitigen Infografik eine Karikatur entgegen.


Eine Grafik kann einen Text in der Regel nicht ersetzen, nur ergänzen!


Reflexion 1-B
Welche Aussagen finden Sie in den Grafiken 6 und 7?

Musterantworten zur Reflexion 1-B


Vertrauenswürdigkeit von Infografiken

Den Wetterkarten (Grafiken 1, 2 und 3) vertrauen wir, weil sie von anerkannten (oft staatlichen) Institutionen produziert und veröffentlicht werden (z.B. MeteoSchweiz, Deutscher Wetterdienst). Und dass die Prognosen nicht immer stimmen, ist uns selbstverständlich klar. Wir verfügen auch über die Fähigkeit, die lokale Wetterentwicklung selbst zu beobachten, mit der Prognose zu vergleichen und daraus Schlüsse zu ziehen.

Wie können wir die Vertrauenswürdigkeit anderer Infografiken abschätzen? Die folgenden Merkmale helfen uns:

  • Die verwendeten Datenquellen sind ausgewiesen, idealerweise ergänzt mit einem Link auf die betreffenden Datensätze.
  • Die Urheberschaft und das Erstellungsjahr der Grafik sind kenntlich gemacht.

Die Grafik 5 nennt beispielsweise das Departement für Verteidigung, Bevölkerungsschutz und Sport (VBS) als Quelle für die Daten. Es fehlt allerdings ein Link (ein Verweis) auf die Daten selbst. Urheber der Grafik ist Klaudia Meisterhans von der TA Grafik kmh (Tagesanzeiger Grafik; die Abkürzung des Namens der UrheberIn ist auf der Grafik kaum lesbar, im Zeitungsartikel sind die Grafikerin und der Autor des Textes aber aufgeführt). Es fehlt die Angabe des Erstellungsjahres (das Datum des Zeitungsartikels ist November 2017). Trotzdem genügen die Angaben, um die Grafik 5 als vertrauenswürdig einzustufen.


Reflexion 1-C
Wie beurteilen Sie die Vertrauenswürdigkeit der Grafiken 6 und 7?

Musterantwort zur Reflexion 1-C


Wie kommen Daten zustande und wo findet man sie?

Wie schon erwähnt gibt es keine allgemein gültige Definition von Daten (Daten). Um die wichtigsten Aspekte des "Sammelns" und "Verarbeitens" von Daten diskutieren zu können, machen wir deshalb spontan eine Umfrage ...

Stichworte: Grundgesamtheit, Stichprobe, Stichprobenumfang, Umgang mit unvollständigen/fehlenden Daten, Durchschnitte, offene Daten


Für Interessierte: Theorie und Übungen zum Thema

Verschiedene Arten von Infografiken

Stichworte: Säulen-, Balken- und Tortengrafiken, Linien-, Streu-, Histo-, Kartendiagramme, Box-Plot, Mosaik-Plot, Alluvial-, Chord-Diagramme; Beschriftungen, Skalierung der Achsen/Orientierung bei Kartenausschnitten, passende Symbole, Farben/Muster

Grundlegende Qualitätsmerkmale von Infografiken

Stichworte: Korrektheit (correctness), Ausdruckskraft (expressiveness), Wirksamkeit (effectiveness), Angemessenheit (adequacy)

Vertiefung

Verzerrungen und Fehler erkennen


Leseempfehlung: Wolfgang Walla: Wie man sich durch statistische Grafiken täuschen lässt. Statistisches Landesamt Baden-Württemberg, 2008.

"Rosinen pflücken" (cherry-picking)

Praxis-Beispiel: Covid-19 Daten (aus Maxim Lisnic: How People Actually Lie With Charts)

Visualisierung mit Beschränkung auf einen Ausschnitt.png

Absolute und relative Datenwerte

Skalierung der Datenwerte beginnt nicht bei 0

Um den Unterschied zwischen zwei (oder mehreren) Datenwerten grösser erscheinen zu lassen als er tatsächlich ist, wird die Skala der Datenwerte oft "beschnitten", d.h. sie beginnt nicht bei 0.

Die Skala der Datenwerte beginnt bei 1400
Die Skala der Datenwerte beginnt bei 0

Praxis-Beispiel: Infografik zur Abstimmung über die Reform der beruflichen Vorsorge vom 22.09.2024 (Schweiz) im K-Tipp vom 27.08.2024

BVG-Renten-2.jpg

Heikel ist in diesem Fall auch die Verwendung eines einzelnen, ausgewählten Beispiels, um die allgemeine Aussage zu veranschaulichen.

Logarithmische versus lineare Skalen

Praxis-Beispiel: Covid-19 Daten (aus William H. Ryan & Ellen R. K. Evers: Graphs with logarithmic axes distort lay judgments)

Logarithmische versus lineare Darstellung gleicher Daten.png

Kausalität oder nur Korrelation? (Ursache und Wirkung oder nur Ähnlichkeit?)

Grafiken verbessern und selber machen

Programme: z.B. https://www.rawgraphs.io, https://www.datawrapper.de/