Auf lange Sicht

Raus aus der Fussnote, rein in die Geschichte

Die Welt blickt gebannt auf Grafiken zur Corona-Pandemie. Die Republik nimmt das zum Anlass, noch genauer über die Methodik von Daten­visualisierungen nachzudenken: ein Versprechen zur «Langen Sicht».

Von Marie-José Kolly und Simon Schmid, 27.07.2020

Die Republik ist ein digitales Magazin für Politik, Wirtschaft, Gesellschaft und Kultur – finanziert von seinen Leserinnen. Es ist komplett werbefrei und unabhängig. Überzeugen Sie sich selber: Lesen Sie 21 Tage lang kostenlos und unverbindlich Probe:

Die Corona-Pandemie überschwemmt uns regelrecht mit Zahlen. Infektionen, Todesfälle, Über­sterblichkeit, Reproduktions­werte: Verschiedenste Daten­sätze zu Covid-19 werden täglich aktualisiert und ins Netz eingespeist, Medien­häuser und Social Media verbreiten sie weiter.

Das hat die Diskussion über das Coronavirus ein Stück weit demokratisiert: Wissenschaftlerinnen und Journalisten sehen sich plötzlich mit viel mehr Mitmenschen konfrontiert, die mit Daten und Statistiken argumentieren.

Das ist erst einmal grossartig. Denn eine Haltung, die sich auf Zahlen und Fakten abstützt, ist in der Regel fundierter als eine haltlos hinausposaunte.

Doch es ist gleichzeitig gefährlich. Denn diese Zahlen sind im Kontext von Covid-19 mit besonders viel Unsicherheit behaftet: Sie unterschätzen die Verbreitung der Epidemie, sie variieren mit Test­kriterien und Methodik – und ihre Erhebung unterscheidet sich von Land zu Land.

Die Datenlage ist also komplex, der Durchblick nicht leicht zu erhalten. Werden einzelne Werte oder Daten­reihen aus Daten­sätzen wie Rosinen aus einem Kuchen herausgepickt – oder wird Apfel- mit Birnenkuchen verglichen –, so lassen sich damit verschiedenste Haltungen begründen: für oder gegen frühe Lockerungen; für oder gegen das «schwedische Modell»; für oder gegen die Vorstellung, dass gerade eine zweite Welle auf die Schweiz zurollen könnte.

Unser Weg, mit diesen Schwierigkeiten umzugehen – und der Mehrwert, den wir Ihnen in der «Langen Sicht» bieten wollen –, ist: die Entstehung der Daten und die Methoden hinter ihrer Darstellung häufiger zum Thema zu machen.

Einige Male haben wir das im Verlauf des Frühlings bereits versucht.

Beispiel 1: Wie verschiedene Länder dastehen

Ende April wollten wir in der «Langen Sicht» zeigen, wo wir stehen: Wie hatte sich die Epidemie in verschiedenen Ländern bis dahin entwickelt? Und wo standen sie, angesichts ihrer Massnahmen gegen die Virusverbreitung?

Am liebsten hätten wir die Entwicklung der Fallzahlen länder­vergleichend und in real time gezeigt. Doch diese Daten sind weniger gut vergleichbar, als sich verantworten lässt.

So haben wir mehrere Tage mit Nachdenken und Hadern verbracht. Denn es gab (und gibt) nicht die richtige, ja nicht einmal eine richtig zuverlässige Metrik, um zu zeigen, was wir zeigen wollten. Die Daten zu allen Variablen, die wir hierzu heranziehen konnten, waren (und sind) mehrheitlich unvollständig und in weiten Teilen unsicher – unpräzise.

Was tun? So sind wir vorgegangen:

  1. Verschiedene Variablen ansehen, nachdenken, viel lesen. Noch mehr nachdenken. Ideen verwerfen, wieder erwägen. Repeat.

  2. Die Metrik wählen, die am wenigsten Nachteile zu haben scheint.

  3. Die Erkenntnis aus dem Nachdenk-Prozess zu einem erheblichen Teil des Artikels machen: Zeigen, worin sich die verschiedenen Metriken unterscheiden und welche – einigermassen gesicherte – Aussage sich aus ihrer Schnitt­menge ergibt. Erklären, warum es keine perfekte Metrik gibt und weshalb wir uns für eine bestimmte Metrik entschieden haben.

Das Ergebnis der Überlegungen finden Sie hier.

Als Fazit nehmen wir daraus mit: Uns ist es wichtig, Sie als Leserinnen transparent über Unsicherheiten im Zusammenhang mit den Daten aufzuklären – und zwar so, dass Sie es nicht übersehen können.

Beispiel 2: Reichen die Spitalkapazitäten?

Schon zuvor, im März, hatten wir an dieser Stelle einen ähnlichen Versuch gemacht: Wir hatten ein Modell berechnet, das zeigte, inwiefern die Pflege­kapazitäten auf den Intensiv­stationen ausreichen würden, um die zu erwartende Zahl von Patienten zu behandeln.

Sollten wir das Modell überhaupt zeigen? Wenn ja, wie?

Wir waren bis zuletzt unsicher. Das Modell hätte missverständlich sein können: als konkrete Prognose statt als Erklärung, welche Mechanismen für diese Frage prinzipiell eine Rolle spielen. Ein entscheidender Unterschied: Epidemiologische Prognosen sind eine Aufgabe für Epidemiologinnen – wir hingegen sind Datenjournalistinnen. Wir können solche Modelle bestenfalls benutzen, um ein bestimmtes Phänomen zu illustrieren oder zu erklären.

Schliesslich entschieden wir uns für eine Publikation.

Bald darauf wurde klar, dass die Schweizer Spitäler nicht an ihre Grenzen kommen würden. Alle Patienten würden Platz finden, denn der «Lockdown light» hatte die Verbreitung des Virus stark verlangsamen können.

Die Erfahrung mit dem Modell hat bestätigt: Es lohnt sich nicht, basierend auf vereinfachenden Rechnungen eine knackige Schlagzeile zu produzieren. Besser ist, über die Rechnung selbst zu reden. Darüber, warum eine Prognose – auch für Fachleute – eigentlich so schwierig zu machen ist. Und immer unsicher bleibt.

Beispiel 3: Die ominöse zweite Welle

Anfang Juli haben haben wir uns schliesslich gefragt: Steuern wir gerade auf eine zweite Welle zu? Oder flackern die Fallzahlen aktuell nur kurz auf?

Eine Kristallkugel haben weder wir noch die Wissenschaftlerinnen, mit denen wir gesprochen haben. Die Frage liess sich zu dem Zeitpunkt nicht abschliessend beantworten. Was sich aber mit Daten zeigen liess: aufgrund welcher Messzahlen man epidemiologische Trends überhaupt erkennen kann.

Die Auswertung ergab ein gemischtes Bild.

Und auch die Wirklichkeit liegt seither irgendwo in der Mitte: Die Ansteckungs­zahlen bewegen sich auf höherem Niveau als im Mai. Aber sie steigen nicht auf vergleichbar explosive Weise an wie im Frühjahr.

Fallzahlen haben sich eingependelt

Anzahl positiv getestete Personen pro Tag

24.02.01.04.01.05.01.06.01.07.07501500 Personen

Quelle: Bundesamt für Gesundheit. Die Daten schliessen auch Covid-19-Patientinnen im Fürstentum Liechten­stein mit ein. Die Daten nach dem 21. Juli sind vermutlich noch unvollständig, deshalb haben wir sie nicht berücksichtigt. Stand aller Grafiken: 23. Juli 2020.

Das hat unsere Vorahnung bestätigt: Der alleinige Fokus auf Einzel­zahlen wie beispielsweise den R-Wert reicht für eine Lage­beurteilung nicht aus, denn die künftige Entwicklung der Infektions­zahlen prägen mittlerweile viele Mechanismen mit. Besser also einmal mehr über die Methoden sprechen, als anhand von einer Daten­reihe spektakuläre Aussagen machen.

Und damit zu unserem Ausblick – und zu einem Versprechen.

Was die «Lange Sicht» leisten soll

Immer wieder haben wir in den vergangenen Monaten Artikel gelesen, die für Schätz­werte mehrere Nachkomma­stellen abbilden. Sie suggerieren damit eine Genauigkeit, die es bei solchen Schätzungen by design nicht gibt. Immer wieder haben wir Grafiken mit Infektionszahlen-Rankings ausgewählter Länder gesehen. Sie suggerieren eine Vergleichbarkeit, die es so nicht gibt.

Was uns dabei nervös macht, ist nicht nur die dritte Nachkomma­stelle oder der Vergleich selbst (das auch), sondern vielmehr: die spärliche Einordnung, der fehlende Disclaimer. Das fehlende Klein­gedruckte zu den Daten.

Genau darauf wollen wir bei der «Langen Sicht» künftig noch mehr Wert legen. Denn im Klein­gedruckten stehen oft die entscheidenden Details. Deshalb werden wir das Klein­gedruckte in Zukunft öfter grösser drucken.

Das heisst:

  • Wir wollen (wie bisher) aufzeigen, was Daten für eine Geschichte zu erzählen haben, was sie aussagen.

  • Dazu diskutieren wir intensiver: Was die Daten aufgrund ihrer Qualität überhaupt auszusagen vermögen.

  • Was der Status mancher Grafiken und Datensätze ist: Vorläufiger Hinweis? Gesicherter Fakt?

  • Welche verschiedenen Zugänge es zu einem Datensatz gibt, welche Visualisierungen davon.

  • Und wir wollen vermehrt beleuchten, welche verschiedenen Interpretationen ein Datensatz zulässt.

Kurz: Disclaimer, die Daten und Methode betreffen – gewissermassen die «Risiken und Nebenwirkungen» von Daten­visualisierungen –, wollen wir verstärkt aus der «Packungs­beilage», den Fussnoten, herausholen. Und sie stattdessen in die Geschichte, in den Artikel selbst einbauen.

Wir betonen dies nicht, um Kritik an anderen Medien zu üben oder an dem, was in den Weiten des Internets alles publiziert und geteilt wird.

Sondern als Erinnerung an uns selbst und als Verpflichtung gegenüber Ihnen.

PS.

Ganz neu ist dieser Ansatz für uns nicht.

Hier eine Sammlung von bereits erschienenen «Lange Sicht»-Beiträgen, in denen die methodischen Fragen einen grösseren Stellenwert einnehmen:

  • Was ist Zersiedelung? Drei Karten illustrieren die Schwierigkeit, einen politischen Begriff in wissenschaftliche Worte zu fassen.

  • Seismografie der Krise: Neue ökonomische Indikatoren wollen die Coronakrise in Echtzeit abbilden. Was taugen sie?

  • Ökonomie des Nonsens: Sollen Länder wie Italien ein Konjunktur­paket beschliessen? Eine Messmethode sagt Ja – eine andere Nein.

5050

Sie sind sich immer noch nicht sicher, ob die Republik etwas für Sie ist? Dann testen Sie uns! Für 21 Tage, kostenlos und unverbindlich:

seit 2018

Republik AG
Sihlhallenstrasse 1
8004 Zürich
Schweiz

kontakt@republik.ch
Medieninformationen

Der Republik Code ist Open Source