Raus aus der Fussnote, rein in die Geschichte
Die Welt blickt gebannt auf Grafiken zur Corona-Pandemie. Die Republik nimmt das zum Anlass, noch genauer über die Methodik von Datenvisualisierungen nachzudenken: ein Versprechen zur «Langen Sicht».
Von Marie-José Kolly und Simon Schmid, 27.07.2020
Unabhängiger Journalismus lebt vom Einsatz vieler
Unterstützen auch Sie die Republik mit einem Abo: Einstiegsangebot nur bis 31. März 2024.
Die Corona-Pandemie überschwemmt uns regelrecht mit Zahlen. Infektionen, Todesfälle, Übersterblichkeit, Reproduktionswerte: Verschiedenste Datensätze zu Covid-19 werden täglich aktualisiert und ins Netz eingespeist, Medienhäuser und Social Media verbreiten sie weiter.
Das hat die Diskussion über das Coronavirus ein Stück weit demokratisiert: Wissenschaftlerinnen und Journalisten sehen sich plötzlich mit viel mehr Mitmenschen konfrontiert, die mit Daten und Statistiken argumentieren.
Das ist erst einmal grossartig. Denn eine Haltung, die sich auf Zahlen und Fakten abstützt, ist in der Regel fundierter als eine haltlos hinausposaunte.
Doch es ist gleichzeitig gefährlich. Denn diese Zahlen sind im Kontext von Covid-19 mit besonders viel Unsicherheit behaftet: Sie unterschätzen die Verbreitung der Epidemie, sie variieren mit Testkriterien und Methodik – und ihre Erhebung unterscheidet sich von Land zu Land.
Die Datenlage ist also komplex, der Durchblick nicht leicht zu erhalten. Werden einzelne Werte oder Datenreihen aus Datensätzen wie Rosinen aus einem Kuchen herausgepickt – oder wird Apfel- mit Birnenkuchen verglichen –, so lassen sich damit verschiedenste Haltungen begründen: für oder gegen frühe Lockerungen; für oder gegen das «schwedische Modell»; für oder gegen die Vorstellung, dass gerade eine zweite Welle auf die Schweiz zurollen könnte.
Unser Weg, mit diesen Schwierigkeiten umzugehen – und der Mehrwert, den wir Ihnen in der «Langen Sicht» bieten wollen –, ist: die Entstehung der Daten und die Methoden hinter ihrer Darstellung häufiger zum Thema zu machen.
Einige Male haben wir das im Verlauf des Frühlings bereits versucht.
Beispiel 1: Wie verschiedene Länder dastehen
Ende April wollten wir in der «Langen Sicht» zeigen, wo wir stehen: Wie hatte sich die Epidemie in verschiedenen Ländern bis dahin entwickelt? Und wo standen sie, angesichts ihrer Massnahmen gegen die Virusverbreitung?
Am liebsten hätten wir die Entwicklung der Fallzahlen ländervergleichend und in real time gezeigt. Doch diese Daten sind weniger gut vergleichbar, als sich verantworten lässt.
So haben wir mehrere Tage mit Nachdenken und Hadern verbracht. Denn es gab (und gibt) nicht die richtige, ja nicht einmal eine richtig zuverlässige Metrik, um zu zeigen, was wir zeigen wollten. Die Daten zu allen Variablen, die wir hierzu heranziehen konnten, waren (und sind) mehrheitlich unvollständig und in weiten Teilen unsicher – unpräzise.
Was tun? So sind wir vorgegangen:
Verschiedene Variablen ansehen, nachdenken, viel lesen. Noch mehr nachdenken. Ideen verwerfen, wieder erwägen. Repeat.
Die Metrik wählen, die am wenigsten Nachteile zu haben scheint.
Die Erkenntnis aus dem Nachdenk-Prozess zu einem erheblichen Teil des Artikels machen: Zeigen, worin sich die verschiedenen Metriken unterscheiden und welche – einigermassen gesicherte – Aussage sich aus ihrer Schnittmenge ergibt. Erklären, warum es keine perfekte Metrik gibt und weshalb wir uns für eine bestimmte Metrik entschieden haben.
Das Ergebnis der Überlegungen finden Sie hier.
Als Fazit nehmen wir daraus mit: Uns ist es wichtig, Sie als Leserinnen transparent über Unsicherheiten im Zusammenhang mit den Daten aufzuklären – und zwar so, dass Sie es nicht übersehen können.
Beispiel 2: Reichen die Spitalkapazitäten?
Schon zuvor, im März, hatten wir an dieser Stelle einen ähnlichen Versuch gemacht: Wir hatten ein Modell berechnet, das zeigte, inwiefern die Pflegekapazitäten auf den Intensivstationen ausreichen würden, um die zu erwartende Zahl von Patienten zu behandeln.
Sollten wir das Modell überhaupt zeigen? Wenn ja, wie?
Wir waren bis zuletzt unsicher. Das Modell hätte missverständlich sein können: als konkrete Prognose statt als Erklärung, welche Mechanismen für diese Frage prinzipiell eine Rolle spielen. Ein entscheidender Unterschied: Epidemiologische Prognosen sind eine Aufgabe für Epidemiologinnen – wir hingegen sind Datenjournalistinnen. Wir können solche Modelle bestenfalls benutzen, um ein bestimmtes Phänomen zu illustrieren oder zu erklären.
Schliesslich entschieden wir uns für eine Publikation.
Bald darauf wurde klar, dass die Schweizer Spitäler nicht an ihre Grenzen kommen würden. Alle Patienten würden Platz finden, denn der «Lockdown light» hatte die Verbreitung des Virus stark verlangsamen können.
Die Erfahrung mit dem Modell hat bestätigt: Es lohnt sich nicht, basierend auf vereinfachenden Rechnungen eine knackige Schlagzeile zu produzieren. Besser ist, über die Rechnung selbst zu reden. Darüber, warum eine Prognose – auch für Fachleute – eigentlich so schwierig zu machen ist. Und immer unsicher bleibt.
Beispiel 3: Die ominöse zweite Welle
Anfang Juli haben haben wir uns schliesslich gefragt: Steuern wir gerade auf eine zweite Welle zu? Oder flackern die Fallzahlen aktuell nur kurz auf?
Eine Kristallkugel haben weder wir noch die Wissenschaftlerinnen, mit denen wir gesprochen haben. Die Frage liess sich zu dem Zeitpunkt nicht abschliessend beantworten. Was sich aber mit Daten zeigen liess: aufgrund welcher Messzahlen man epidemiologische Trends überhaupt erkennen kann.
Die Auswertung ergab ein gemischtes Bild.
Und auch die Wirklichkeit liegt seither irgendwo in der Mitte: Die Ansteckungszahlen bewegen sich auf höherem Niveau als im Mai. Aber sie steigen nicht auf vergleichbar explosive Weise an wie im Frühjahr.
Das hat unsere Vorahnung bestätigt: Der alleinige Fokus auf Einzelzahlen wie beispielsweise den R-Wert reicht für eine Lagebeurteilung nicht aus, denn die künftige Entwicklung der Infektionszahlen prägen mittlerweile viele Mechanismen mit. Besser also einmal mehr über die Methoden sprechen, als anhand von einer Datenreihe spektakuläre Aussagen machen.
Und damit zu unserem Ausblick – und zu einem Versprechen.
Was die «Lange Sicht» leisten soll
Immer wieder haben wir in den vergangenen Monaten Artikel gelesen, die für Schätzwerte mehrere Nachkommastellen abbilden. Sie suggerieren damit eine Genauigkeit, die es bei solchen Schätzungen by design nicht gibt. Immer wieder haben wir Grafiken mit Infektionszahlen-Rankings ausgewählter Länder gesehen. Sie suggerieren eine Vergleichbarkeit, die es so nicht gibt.
Was uns dabei nervös macht, ist nicht nur die dritte Nachkommastelle oder der Vergleich selbst (das auch), sondern vielmehr: die spärliche Einordnung, der fehlende Disclaimer. Das fehlende Kleingedruckte zu den Daten.
Genau darauf wollen wir bei der «Langen Sicht» künftig noch mehr Wert legen. Denn im Kleingedruckten stehen oft die entscheidenden Details. Deshalb werden wir das Kleingedruckte in Zukunft öfter grösser drucken.
Das heisst:
Wir wollen (wie bisher) aufzeigen, was Daten für eine Geschichte zu erzählen haben, was sie aussagen.
Dazu diskutieren wir intensiver: Was die Daten aufgrund ihrer Qualität überhaupt auszusagen vermögen.
Was der Status mancher Grafiken und Datensätze ist: Vorläufiger Hinweis? Gesicherter Fakt?
Welche verschiedenen Zugänge es zu einem Datensatz gibt, welche Visualisierungen davon.
Und wir wollen vermehrt beleuchten, welche verschiedenen Interpretationen ein Datensatz zulässt.
Kurz: Disclaimer, die Daten und Methode betreffen – gewissermassen die «Risiken und Nebenwirkungen» von Datenvisualisierungen –, wollen wir verstärkt aus der «Packungsbeilage», den Fussnoten, herausholen. Und sie stattdessen in die Geschichte, in den Artikel selbst einbauen.
Wir betonen dies nicht, um Kritik an anderen Medien zu üben oder an dem, was in den Weiten des Internets alles publiziert und geteilt wird.
Sondern als Erinnerung an uns selbst und als Verpflichtung gegenüber Ihnen.
PS.
Ganz neu ist dieser Ansatz für uns nicht.
Hier eine Sammlung von bereits erschienenen «Lange Sicht»-Beiträgen, in denen die methodischen Fragen einen grösseren Stellenwert einnehmen:
Wie stark sind die Mieten gestiegen? Sechs verschiedene Datenreihen geben unterschiedliche Antworten.
Wie ungleich die Einkommen verteilt sind: Jede Aussage ist nur so gut wie die Daten, auf denen sie beruht.
Was ist Zersiedelung? Drei Karten illustrieren die Schwierigkeit, einen politischen Begriff in wissenschaftliche Worte zu fassen.
Seismografie der Krise: Neue ökonomische Indikatoren wollen die Coronakrise in Echtzeit abbilden. Was taugen sie?
Wie viele Schulden hat die Schweiz? Warum man es sich mit Finanzstatistiken nicht zu einfach machen darf.
Wie Daten Rassismus sichtbar machen – und wo ihre Grenzen sind. Sollen Statistikämter die Hautfarbe von Einwohnern erfassen?
Ökonomie des Nonsens: Sollen Länder wie Italien ein Konjunkturpaket beschliessen? Eine Messmethode sagt Ja – eine andere Nein.