Die Schönheit der Zahlen
Fakten ausbreiten, Gedanken vermitteln, Empathie schaffen: Datenjournalismus kann viel mehr als bloss Statistiken visualisieren. Ein paar inspirierende Beispiele zur Pandemie.
Von Simon Schmid, 27.12.2021
Die Republik ist ein digitales Magazin für Politik, Wirtschaft, Gesellschaft und Kultur – finanziert von seinen Leserinnen. Es ist komplett werbefrei und unabhängig. Lösen Sie jetzt ein Abo oder eine Mitgliedschaft!
An und für sich ist Datenjournalismus nichts Neues. Seit es Zeitungen gibt, werden darin auch Zahlen veröffentlicht. Und bereits im 19. Jahrhundert wurde ausgiebig mit Infografiken und Visualisierungen experimentiert.
Doch zu einer eigenständigen Subdisziplin, die mit spezialisierten Teams vorangetrieben wird, hat sich der Datenjournalismus erst seit gut zehn Jahren entwickelt. Voraussetzungen dafür bildeten die Verbreitung von Computern und das Internet. Es wurde einfacher, an Daten zu gelangen, diese grafisch darzustellen und sie einem breiten Publikum zu vermitteln.
Die Corona-Pandemie hat dem Datenjournalismus zusätzlichen Auftrieb verliehen. Noch nie dürfte rund um die Welt so viel datengetriebene Berichterstattung konsumiert worden sein wie in den letzten zwei Jahren.
Dabei hat sich auf eindrückliche Weise gezeigt, was Datenjournalismus leisten kann – wenn er gewissenhaft, intelligent und kreativ gemacht wird.
1. Datenjournalismus vermittelt Fakten
Sie sind das Markenzeichen des Covid-19-Datenjournalismus und aus dem Informationsalltag nicht mehr wegzudenken: die Dashboards zur Pandemie.
Ansteckungen, Hospitalisierungen, Todeszahlen, Positivitätsraten, Virusvarianten – aufgeschlüsselt nach Altersgruppen, geografischen Einheiten, Impfstatus: Wer sich ein Bild über den Verlauf der Pandemie machen will, kommt um Corona-Dashboards nicht herum. Auch in der Schweiz nicht: Vom Schweizer Radio und Fernsehen über die Tamedia-Zeitungen und die «Neue Zürcher Zeitung» bis zu «Watson» haben viele Medien online Informationsseiten eingerichtet, die sich automatisch updaten und aus verschiedenen Quellen die neuesten Corona-Statistiken zusammentragen.
Auch das Bundesamt für Gesundheit betreibt ein sehr übersichtliches Covid-19-Dashboard, aus dem ein Teil der Daten stammt, die bei den Medienhäusern zu sehen sind. Letztere erbringen gegenüber den amtlichen Dashboards allerdings einen journalistischen Mehrwert:
Selektion: Nicht alle Grafiken werden gezeigt, sondern eine auf die Zielgruppe des jeweiligen Mediums zugeschnittene Auswahl. Die wichtigsten Grafiken kommen zuerst, die weniger wichtigen zuletzt.
Erklärung: Grafiken werden mit aussagekräftigen Titeln versehen («Omikron verbreitet sich in der Schweiz») und mit Textpassagen ergänzt, aus denen hervorgeht, wie man die Grafik interpretieren muss.
Annotation: Bestimmte Elemente einer Grafik werden optisch hervorgehoben und gleich daneben mit Text kommentiert.
Aggregierung: Daten aus diversen Quellen und Ländern fliessen ins Dashboard ein. Das ermöglicht zum Beispiel internationale Vergleiche.
Dass Medienhäuser jeden Tag aufs Neue die aktuellen Entwicklungen nachzeichnen können, ist nicht nur den Fähigkeiten ihrer Datenteams geschuldet. Es liegt auch daran, dass seitens der Behörden (teils nach einigen Anlaufschwierigkeiten) ein wichtiges Konzept umgesetzt wurde: Open Data.
Open Data bedeutet, dass Ämter oder Forschungseinrichtungen ihre Datensätze möglichst zeitnah und in für Computer lesbarer Form (also zum Beispiel nicht als PDF-Datei) im Internet publizieren. Das Statistische Amt des Kantons Zürich hat diesbezüglich Pionierarbeit geleistet.
2. Datenjournalismus zeigt Dynamiken auf
Statistiken zusammenzutragen, ist ein elementarer Bestandteil des Datenjournalismus. Aber längst nicht das Einzige, was er zu bieten hat.
Das verdeutlichen zwei Beiträge, die die «Washington Post» im Frühjahr 2020 veröffentlicht hat: «How epidemics like Covid-19 end» (Wie Epidemien wie Covid-19 enden) und «Why outbreaks like coronavirus spread exponentially» (Warum Ausbrüche wie das Coronavirus sich exponentiell verbreiten).
Die beiden Arbeiten enthalten eine Reihe animierter Grafiken. Auf ihnen fliegt eine bunte Vielzahl von Punkten umher: pink, hellblau, orange. Diese Punkte symbolisieren eine Gruppe von Menschen während einer Pandemie. Je nach Farbe sind sie infiziert, krank oder genesen. Das Wechselspiel illustriert, wie sich ein Virus den Weg durch die Gesellschaft bahnen kann. Manchmal geht dies sehr rasch – und manchmal weniger rasch, wenn etwa nur ein Teil der Punkte in Bewegung ist, während der Rest stationär bleibt.
Screen-Videoshot: «Washington Post».
Die zwei Simulationen führen vor, wie sich exponentielles Wachstum tatsächlich anfühlt. Dass ein Teich an einem Tag erst zur Hälfte und am nächsten Tag bereits vollständig mit Seerosen bedeckt sein kann: Diese Analogie mögen die meisten Leute noch begreifen. Doch vielen Menschen fällt es schwer, sie auf andere Kontexte zu übertragen – besonders dann, wenn eine exponentielle Wachstumskurve erst ganz am Anfang steht, also wenn in einem riesigen See erst ein paar wenige Seerosen zu finden sind.
Screen-Videoshot: «Washington Post».
Mangelndes Verständnis für exponentielles Wachstum (gepaart mit der tückischen Tatsache, dass sich der Ausbreitungsstand des Virus immer nur mit einigen Tagen Verspätung beobachten lässt) ist der Grund dafür, dass die Behörden vieler Länder immer wieder zu lange zuwarteten, bis sie Massnahmen zur Eindämmung der Pandemie beschlossen. Es ist auch der Grund, warum viele Bürgerinnen kein Verständnis für diese Massnahmen haben («Die Intensivstationen sind ja gar noch nicht voll!»).
Umso wichtiger ist der Aufklärungsbeitrag, den der Datenjournalismus mit solchen interaktiven und animierten Visualisierungen leisten kann.
3. Datenjournalismus erzeugt Empathie
Datenteams liefern die Zahlen, Reporter die Geschichten und Gefühle: So ungefähr sieht die klassische Rollenverteilung auf vielen Redaktionen aus. Dass diese Trennung so nicht sein muss, hat ein Journalistentrio vom Rundfunk Berlin-Brandenburg diesen September in einem innovativen Beitrag gezeigt.
«Wie Mütter und Väter zwei unterschiedliche Pandemien erlebten» ist eine Datenstory über das Familienleben während der Corona-Krise. Sie nimmt die Leserinnen mit in einen typischen Tagesablauf: aufstehen, Frühstück machen und so weiter. Doch während des Scrollens verändert sich plötzlich der Text: Wo früher 6.45 Uhr stand, steht jetzt 6.30 Uhr. Eine Folge der Pandemie: Homeoffice und Homeschooling verursachen einen grösseren Koordinationsaufwand, deshalb brauchen am Morgen alle mehr Zeit.
Screen-Videoshot: «rbb24»
So erfahren die Leser zu jeder Tageszeit, welchen Mehraufwand die Pandemie im Haushalt und bei der Kinderbetreuung verursacht. Laufend wird ihnen auch vorgerechnet, welche Familienmitglieder davon wie stark betroffen sind. Basis dieser Rechnungen sind diverse Studien zum Thema Care-Arbeit, die in Deutschland während der Pandemie gemacht wurden.
Braucht es zwingend solche datengetriebenen Formate, damit die Öffentlichkeit realisiert, wie sich das Familienleben während eines Shutdowns verkompliziert?
Das nicht, denn das Thema wurde auch in konventionellen Audio-, Video- und Textbeiträgen ausgiebig abgehandelt. Doch das Beispiel beweist: Auch Datenjournalismus kann Empathie wecken und Emotionen transportieren.
4. Datenjournalismus rüttelt auf
Ein wichtiger Faktor dabei sind Datenvisualisierungen. Welchen Eindruck sie bei der Betrachterin entfalten können, hat die Infografikabteilung der Nachrichtenagentur Reuters am 22. Februar dieses Jahres vorgemacht.
An diesem Tag wurde in den USA eine traurige Schwelle überschritten: Die Pandemie hatte ihr fünfhunderttausendstes Todesopfer gefordert. Um die Ungeheuerlichkeit dieser Zahl vor Augen zu führen, entschlossen sich die Grafiker bei Reuters, jeden dieser Todesfälle als schwarzen Punkt auf einer Zeitleiste einzuzeichnen. Diese läuft von oben nach unten und nimmt sich erst ganz bruchstückhaft aus – wie eine schmale Linie von Sandkörnern.
Doch schon bald werden die Punkte immer zahlreicher: Dutzende, Hunderte, Tausende von schwarzen Tupfern vereinigen sich und ziehen als riesiger Schwarm von Covid-19-Todesopfern über den Bildschirm, während man die Zeitachse entlang vom Pandemiebeginn bis zu Gegenwart scrollt. Hie und da wird eine Tote beim Namen genannt und mit einem kurzen Lebenslauf geehrt – ein Hinweis darauf, dass hinter jedem Punkt ein Schicksal steht.
Video-Screenshot: Reuters.
«500’000 lives lost» (500’000 Leben verloren) wirkt überwältigend, und genau darin liegen Sinn und Zweck dieser nicht enden wollenden Datenvisualisierung. Das Publikum soll aufgerüttelt werden und vielleicht auch ins Grübeln kommen – darüber, ob sich manche der Corona-Todesopfer nicht hätten vermeiden lassen.
5. Datenjournalismus stellt zentrale Fragen
Wenn Statistiken zu politischen Steuerungsgrössen werden, führt das oft zu Kontroversen. Wie viele Personen wurden wirklich mit dem Virus infiziert? Wie viele Menschen starben tatsächlich als Folge einer Infektion?
Nicht nur die Wissenschaft, auch der Datenjournalismus musste in der Anfangsphase der Pandemie einen Lernprozess durchlaufen. Für die vielen Fragen rund um Covid-19 mussten passende Quellen herangezogen und richtige Interpretationen gefunden werden. Dabei stand nicht nur die eigene Glaubwürdigkeit auf dem Spiel: Die Art und Weise, wie Medien mit Zahlen umgingen – idealerweise behutsam, aber konsistent –, beeinflusste auch die Einstellung der breiten Bevölkerung zur Pandemie und deren Bekämpfung.
Eine besondere Herausforderung war, neben den zentralen Botschaften, die sich aus den Daten ergeben, auch auf die Ungewissheiten hinzuweisen – also auf das, was man selbst in der Forschung noch nicht genau weiss. Es ist insofern kein Zufall, dass der Datenjournalismus während der Pandemie näher an die Wissenschaft herangerückt ist. Data-driven journalism bedient sich zunehmend Methoden, die in data science gebräuchlich sind.
Ein Beispiel dafür findet sich beim «Economist»: «The pandemic’s true death toll» (Die wahre Zahl der Pandemie-Todesopfer). Dabei handelt es sich nicht um eine einmalige Datengeschichte, sondern um einen eigens entwickelten Indikator, den das Datenteam der britischen Zeitschrift seit Mai 2021 täglich aktualisiert.
Der Indikator kontrastiert die offiziellen Todesfallzahlen mit einer Schätzung darüber, wie viele Menschen tatsächlich an Covid-19 gestorben sind. Anlass für eine solche Schätzung sind die unvollständigen offiziellen Zahlen: Vor allem in Entwicklungs- und Schwellenländern wird mangels Testequipment und medizinischer Infrastruktur längst nicht jede Person registriert, die im Zusammenhang mit dem Coronavirus gestorben ist.
Um die tatsächlichen Sterbezahlen zu ermitteln, stützt sich der «Economist» auf eine Reihe von Grössen. Dazu gehören die sogenannte Übersterblichkeit (Wie viele Menschen sterben in einem normalen Jahr, wie viele Menschen starben dieses Jahr?) oder die Testpositivität in einem bestimmten Land zu einem bestimmten Zeitpunkt (welcher Anteil der Corona-Tests fällt positiv aus?). Insgesamt fliessen 121 Subindikatoren ins Modell ein. Ein Machine-Learning-Algorithmus ermittelt sodann, welche von ihnen die grösste Aussagekraft haben. Dieser Algorithmus produziert schliesslich auch eine Bandbreite von Schätzungen für die tatsächlichen Sterbezahlen.
Stand heute sind laut «Economist» weltweit rund 18 Millionen Menschen der Pandemie zum Opfer gefallen. Das wären drei- bis viermal mehr als aus den offiziellen Statistiken hervorgeht – und ein weiterer Grund, das Virus nicht zu verharmlosen. (Die seit Pandemiebeginn kursierende Vorstellung, dass viele Corona-Tote nicht «an», sondern bloss «mit» dem Virus gestorben seien, führt übrigens in die Irre, wie Untersuchungen etwa aus Deutschland zeigen.)
Selbstverständlich sollte man nicht den Fehler machen, sämtliche Ergebnisse des Datenjournalismus für unverrückbare Wahrheiten zu halten. Einer solchen Verklärung wirken seriöse Autorinnen am besten gleich selbst entgegen, indem sie Daten in Form von Wahrscheinlichkeiten darstellen.
So innovativ sich der Datenjournalismus in der Pandemie gezeigt hat, so klar ist auch, dass er sich in den kommenden Jahren weiterentwickeln wird. Nach den Erfahrungen der letzten zwei Jahre darf man sich darauf freuen.