Statistiken1: Unterschied zwischen den Versionen
Keine Bearbeitungszusammenfassung |
|||
(21 dazwischenliegende Versionen von 2 Benutzern werden nicht angezeigt) | |||
Zeile 15: | Zeile 15: | ||
* [https://www.urban.org/events/alberto-cairo-misleading-data-and-visualizations Alberto Cairo on Misleading Data and Visualizations] (Vortragsaufzeichnung "Visual Trumpery. How to fight against fake data and visualizations - from the left and from the right). | * [https://www.urban.org/events/alberto-cairo-misleading-data-and-visualizations Alberto Cairo on Misleading Data and Visualizations] (Vortragsaufzeichnung "Visual Trumpery. How to fight against fake data and visualizations - from the left and from the right). | ||
== '''Grundlagen''' == | == '''Grundlagen''' == | ||
Zeile 49: | Zeile 48: | ||
Die Berichterstattung in den Medien bedient sich ebenfalls häufig grafischer Darstellungen von Daten, um wichtige Aussagen leichter verständlich zu machen. | Die Berichterstattung in den Medien bedient sich ebenfalls häufig grafischer Darstellungen von Daten, um wichtige Aussagen leichter verständlich zu machen. | ||
| | | | ||
[[Datei: | [[Datei:ArmeeBudget.jpg|mini|Grafik 5: Fotografie einer Infografik zum Verfallsdatum von Waffen der Schweizer Armee (Quelle: [https://www.derbund.ch/nicht-nur-jets-die-schweiz-muss-fast-alle-waffensysteme-ersetzen-645122316025 Der Bund])]] | ||
}} | }} | ||
<br /> | <br /> | ||
Zeile 75: | Zeile 74: | ||
Um die Grafiken lesen und verstehen zu können, müssen wir die verwendeten ''Symbole'' und die ''Abbildungsregeln'' kennen (vergleichbar mit den Buchstaben und den zur Wort- und Satzbildung benötigten Regeln, die wir kennen müssen, um Texte verstehen zu können).</big>|Hervorhebung1 | Um die Grafiken lesen und verstehen zu können, müssen wir die verwendeten ''Symbole'' und die ''Abbildungsregeln'' kennen (vergleichbar mit den Buchstaben und den zur Wort- und Satzbildung benötigten Regeln, die wir kennen müssen, um Texte verstehen zu können).</big>|Hervorhebung1 | ||
}} | }} | ||
<br/> | <br/>Beispielsweise repräsentieren in der Wetterprognose-Grafik (Grafik 1) die Grösse des Symbols der Sonne und die Grösse des Wolkensymbols die Wetterlagen "sonnig/wolkenlos", "leicht bewölkt" und "wolkig/stark bewölkt". | ||
Beispielsweise repräsentieren in der Wetterprognose-Grafik (Grafik 1) die Grösse des Symbols der Sonne und die Grösse des | |||
In der Grafik 2 ist die Niederschlagsmenge auf das Symbol "Säule" abgebildet. Die Länge der Säule repräsentiert den Wert der Niederschlagsmenge. Die Länge der senkrechten (vertikalen) Strecke repräsentiert die Unsicherheit der Prognose, dh. die maximale und die minimale zu erwartende Niederschlagsmenge. | In der Grafik 2 ist die Niederschlagsmenge auf das Symbol "Säule" abgebildet. Die Länge der Säule repräsentiert den Wert der Niederschlagsmenge. Die Länge der senkrechten (vertikalen) Strecke repräsentiert die Unsicherheit der Prognose, dh. die maximale und die minimale zu erwartende Niederschlagsmenge. | ||
Zeile 193: | Zeile 189: | ||
=== Verzerrungen und Fehler erkennen === | === Verzerrungen und Fehler erkennen === | ||
<br/> | |||
Leseempfehlung: Wolfgang Walla: [https://www.statistischebibliothek.de/mir/servlets/MCRFileNodeServlet/BWMonografie_derivate_00000082/8020_08001.pdf Wie man sich durch statistische Grafiken täuschen lässt]. Statistisches Landesamt Baden-Württemberg, 2008. | |||
==== "Rosinen pflücken" (cherry-picking) ==== | |||
'''Praxis-Beispiel''': Covid-19 Daten (aus [https://vdl.sci.utah.edu/blog/2023/04/17/misleading/ Maxim Lisnic: How People Actually Lie With Charts]) | |||
[[Datei:Visualisierung mit Beschränkung auf einen Ausschnitt.png|mini|center]] | |||
[[Datei:Corona-Daten-USA-1.png|mini|center|Quelle: https://coronavirus.jhu.edu/region/united-states]] | |||
==== Absolute und relative Datenwerte ==== | |||
==== Skalierung der Datenwerte beginnt nicht bei 0 ==== | |||
Um den Unterschied zwischen zwei (oder mehreren) Datenwerten grösser erscheinen zu lassen als er tatsächlich ist, wird die Skala der Datenwerte oft "beschnitten", d.h. sie beginnt nicht bei 0. | |||
{{2Spalten | |||
| | |||
[[Datei:SkalaDerDatenwerteBeginntNichtBeiNull.png|mini|center|Die Skala der Datenwerte beginnt bei 1400]] | |||
| | |||
[[Datei:SkalaDerDatenwerteBeginntBeiNull.png|mini|center|Die Skala der Datenwerte beginnt bei 0]] | |||
}} | |||
'''Praxis-Beispiel''': Infografik zur Abstimmung über die Reform der beruflichen Vorsorge vom 22.09.2024 (Schweiz) im [https://www.ktipp.ch/fileadmin/content/magazine/ktipp/2024/14/PDF/01-08-KT-1324-PKspezial-LOW.pdf K-Tipp vom 27.08.2024] | |||
[[Datei:BVG-Renten-2.jpg|mini|center]] | |||
Heikel ist in diesem Fall auch die Verwendung eines einzelnen, ausgewählten Beispiels, um die allgemeine Aussage zu veranschaulichen. | |||
=== Logarithmische versus lineare Skalen === | |||
'''Praxis-Beispiel''': Covid-19 Daten (aus [https://behavioralpolicy.org/wp-content/uploads/2021/01/BSP-Journal_Special-Online-Covid_Ryan-Evers_2nd-2024 William H. Ryan & Ellen R. K. Evers: Graphs with logarithmic axes distort lay judgments]) | |||
[[Datei:Logarithmische versus lineare Darstellung gleicher Daten.png|mini|center]] | |||
=== Kausalität oder nur Korrelation? (Ursache und Wirkung oder nur Ähnlichkeit?)=== | === Kausalität oder nur Korrelation? (Ursache und Wirkung oder nur Ähnlichkeit?)=== | ||
Zeile 199: | Zeile 231: | ||
Programme: z.B. https://www.rawgraphs.io, https://www.datawrapper.de/ | Programme: z.B. https://www.rawgraphs.io, https://www.datawrapper.de/ | ||
---- | ---- | ||
{{Autorenbox}} |
Version vom 19. November 2024, 13:54 Uhr
Infografiken lesen und verstehen
work in progress!
Einleitung
Wissenschaftliche Erkenntnisse und Entscheide in Politik und Wirtschaft gründen in der Regel auf statistischen Auswertungen von Studien, Umfragen, Messungen oder Analysen. Zeitungen und Zeitschriften, Webseiten und Lehrbücher bringen uns die Ergebnisse in der Folge mit grafischen Darstellungen, sogenannten Infografiken, nahe.
Infografiken stellen komplexe Sachverhalte anschaulich dar. Sie sind meist farbig und machen Eindruck. Aber Achtung: Nicht alle Infografiken sind leicht verständlich! Manche liefern ein verzerrtes Bild der Sachverhalte. Hin und wieder sind die Grafiken – absichtlich oder unabsichtlich – sogar falsch, und bei neuartigen Visualisierungen fehlt uns vielleicht die Erfahrung, sie verstehen und als Grundlage für unsere Meinungsbildung nutzen zu können.
Kompetenz im Umgang mit Information und Daten ist nötig, um am gesellschaftlichen und politischen Dialog aktiv teilnehmen zu können. Auch in Unternehmen sind Informations- und Datenkompetenz unabdingbar. Dazu gehört die Fähigkeit, grafische Darstellungen von Daten (Infografiken) lesen und verstehen zu können.
Mehr zu Thema:
- Alberto Cairo on Misleading Data and Visualizations (Vortragsaufzeichnung "Visual Trumpery. How to fight against fake data and visualizations - from the left and from the right).
Grundlagen
Infografiken im Alltag
Grafische Darstellungen von Wetterdaten sind wohl die bekanntesten Beispiele von Infografiken im Alltag.
(zum Vergrössern der Bilder auf das Lupen-Symbol klicken)
Die Berichterstattung in den Medien bedient sich ebenfalls häufig grafischer Darstellungen von Daten, um wichtige Aussagen leichter verständlich zu machen.
Statistische Ämter publizieren laufend Infografiken zuhanden der Bevölkerung, um die Ergebnisse von Erhebungen und Analysen anschaulich darzustellen.
Auch in der Wissenschaftskommunikation spielen Infografiken eine Rolle, um komplexe wissenschaftliche Zusammenhänge durch Visualisierungen und grafische Aufarbeitung verständlich zu machen.
Daten und deren Werte, Symbole und deren Merkmale, Legenden
In einer Infografik sind die interessierenden Daten auf Symbole abgebildet. Die unterschiedlichen Merkmale der Symbole repräsentieren die Art und den Wert der dargestellten Daten.
Um die Grafiken lesen und verstehen zu können, müssen wir die verwendeten Symbole und die Abbildungsregeln kennen (vergleichbar mit den Buchstaben und den zur Wort- und Satzbildung benötigten Regeln, die wir kennen müssen, um Texte verstehen zu können).
Beispielsweise repräsentieren in der Wetterprognose-Grafik (Grafik 1) die Grösse des Symbols der Sonne und die Grösse des Wolkensymbols die Wetterlagen "sonnig/wolkenlos", "leicht bewölkt" und "wolkig/stark bewölkt".
In der Grafik 2 ist die Niederschlagsmenge auf das Symbol "Säule" abgebildet. Die Länge der Säule repräsentiert den Wert der Niederschlagsmenge. Die Länge der senkrechten (vertikalen) Strecke repräsentiert die Unsicherheit der Prognose, dh. die maximale und die minimale zu erwartende Niederschlagsmenge.
Die in grafischen Darstellungen von Wetterdaten (Grafik 1) verwendeten Symbole sind uns vertraut: Sonne, Wolken, Regenschirm, usw. Auch Symbole wie die Säulen in Grafik 2 verstehen wir ohne Weiteres. Trotzdem hilft eine Erklärung der verwendeten Symbole (eine Legende), die jeweilige Infografik zu verstehen. Beispielsweise sind detailliertere Wetterkarten, die MeteorologInnen einen raschen Überblick über die allgemeine Wetterlage vermitteln (Grafik 3), für uns Laien nicht so leicht verständlich; wir benötigen die Legende, um uns mit den entsprechenden Symbolen vertraut machen zu können.
Aussagen und Interpretationen
Was die Grafik 1 über das Wetter aussagt, wird uns sofort klar: Am Donnerstag ist es voraussichtlich stärker bewölkt als am Dienstag und deutlich kälter, ausserdem muss mit Regenschauern gerechnet werden. Wir interpretieren die Aussagen dahingehend, dass wir am Donnerstag vielleicht doch eher ein Museum besuchen als eine Wanderung unternehmen sollten. Wir sind uns aber bewusst, dass sich das Wetter am Donnerstag nicht unbedingt an die Prognose halten wird ;-). Deshalb werfen wir in den kommenden Tagen immer wieder einen Blick auf die aktuelle Wetter-Grafik und schauen auch noch selbst zum Himmel, bevor wir uns definitiv entscheiden..
Welche Aussage(n) finden wir in der Grafik 5? Eine erste Antwort liefert der Titel: "Die Verfallsdaten der Waffen der Schweizer Armee". Aller Waffen? Nein, der Untertitel präzisiert: "... der wichtigsten Waffensysteme der Luftwaffe und des Heeres". Die Grafik veranschaulicht einen banalen Sachverhalt. Um diese Aussage zu vermitteln, würde eine Tabelle genügen.
Waffe | im Einsatz seit | Anzahl | Verfallsdatum |
---|---|---|---|
Kampfjet F5 Tiger | 1978 | 53 | 2020 / Q1 |
Flab-Lenkwaffe Rapier | 1984 | 40 | 2020 / Q3 |
Fliegerradar Taflir | 1987 | 5 | 2021 / Q3 |
35mm-Flab-Kanone | 1963 | 24 | 2025 / Q1 |
usw. |
Welche Interpretationen lässt diese Grafik zu? Die Schweizer Armee verfügt nicht mehr über genügend Waffen? Die Scheizer Armee hat es versäumt, das Waffenarsenal rechtzeitig zu erneuern?
Wir können nur spekulieren. Für eine Interpretation wären zusätzliche Daten nötig, z.B. über die geplanten, bewilligten und budgetierten Beschaffungen. Vielleicht liefert der Zeitungsartikel, dem die Grafik entnommen ist (Der Bund: "Nicht nur Jets – die Schweiz muss fast alle Waffensysteme ersetzen"), mehr Information? Der Text schafft Klarheit: Es geht um die Rüstungsbedürfnisse der Schweizer Militärs (2017). Den hohen Ansprüchen des Militärs steht die Ablehnung armeekritischer Gruppierungen gegenüber. Der Artikel ist ausgewogen, er lässt beide Seiten zu Wort kommen, und er setzt der einseitigen Infografik eine Karikatur entgegen.
Vertrauenswürdigkeit von Infografiken
Den Wetterkarten (Grafiken 1, 2 und 3) vertrauen wir, weil sie von anerkannten (oft staatlichen) Institutionen produziert und veröffentlicht werden (z.B. MeteoSchweiz, Deutscher Wetterdienst). Und dass die Prognosen nicht immer stimmen, ist uns selbstverständlich klar. Wir verfügen auch über die Fähigkeit, die lokale Wetterentwicklung selbst zu beobachten, mit der Prognose zu vergleichen und daraus Schlüsse zu ziehen.
Wie können wir die Vertrauenswürdigkeit anderer Infografiken abschätzen? Die folgenden Merkmale helfen uns:
- Die verwendeten Datenquellen sind ausgewiesen, idealerweise ergänzt mit einem Link auf die betreffenden Datensätze.
- Die Urheberschaft und das Erstellungsjahr der Grafik sind kenntlich gemacht.
Die Grafik 5 nennt beispielsweise das Departement für Verteidigung, Bevölkerungsschutz und Sport (VBS) als Quelle für die Daten. Es fehlt allerdings ein Link (ein Verweis) auf die Daten selbst. Urheber der Grafik ist Klaudia Meisterhans von der TA Grafik kmh (Tagesanzeiger Grafik; die Abkürzung des Namens der UrheberIn ist auf der Grafik kaum lesbar, im Zeitungsartikel sind die Grafikerin und der Autor des Textes aber aufgeführt). Es fehlt die Angabe des Erstellungsjahres (das Datum des Zeitungsartikels ist November 2017). Trotzdem genügen die Angaben, um die Grafik 5 als vertrauenswürdig einzustufen.
Wie kommen Daten zustande und wo findet man sie?
Wie schon erwähnt gibt es keine allgemein gültige Definition von Daten (Daten). Um die wichtigsten Aspekte des "Sammelns" und "Verarbeitens" von Daten diskutieren zu können, machen wir deshalb spontan eine Umfrage ...
Stichworte: Grundgesamtheit, Stichprobe, Stichprobenumfang, Umgang mit unvollständigen/fehlenden Daten, Durchschnitte, offene Daten
Für Interessierte: Theorie und Übungen zum Thema
- Beschreibende Statistik/Grundgesamtheit, Stichprobe und Stichprobenumfang
- Beschreibende Statistik/Merkmal und Merkmalsausprägungen
- Beschreibende Statistik/Lagemaße
Verschiedene Arten von Infografiken
Stichworte: Säulen-, Balken- und Tortengrafiken, Linien-, Streu-, Histo-, Kartendiagramme, Box-Plot, Mosaik-Plot, Alluvial-, Chord-Diagramme; Beschriftungen, Skalierung der Achsen/Orientierung bei Kartenausschnitten, passende Symbole, Farben/Muster
Grundlegende Qualitätsmerkmale von Infografiken
Stichworte: Korrektheit (correctness), Ausdruckskraft (expressiveness), Wirksamkeit (effectiveness), Angemessenheit (adequacy)
Vertiefung
Verzerrungen und Fehler erkennen
Leseempfehlung: Wolfgang Walla: Wie man sich durch statistische Grafiken täuschen lässt. Statistisches Landesamt Baden-Württemberg, 2008.
"Rosinen pflücken" (cherry-picking)
Praxis-Beispiel: Covid-19 Daten (aus Maxim Lisnic: How People Actually Lie With Charts)
Absolute und relative Datenwerte
Skalierung der Datenwerte beginnt nicht bei 0
Um den Unterschied zwischen zwei (oder mehreren) Datenwerten grösser erscheinen zu lassen als er tatsächlich ist, wird die Skala der Datenwerte oft "beschnitten", d.h. sie beginnt nicht bei 0.
Praxis-Beispiel: Infografik zur Abstimmung über die Reform der beruflichen Vorsorge vom 22.09.2024 (Schweiz) im K-Tipp vom 27.08.2024
Heikel ist in diesem Fall auch die Verwendung eines einzelnen, ausgewählten Beispiels, um die allgemeine Aussage zu veranschaulichen.
Logarithmische versus lineare Skalen
Praxis-Beispiel: Covid-19 Daten (aus William H. Ryan & Ellen R. K. Evers: Graphs with logarithmic axes distort lay judgments)
Kausalität oder nur Korrelation? (Ursache und Wirkung oder nur Ähnlichkeit?)
Grafiken verbessern und selber machen
Programme: z.B. https://www.rawgraphs.io, https://www.datawrapper.de/