Daten, Daten, Daten
Von Fabienne Kinzelmann und Marie-Lena Hutfils, ifp/JONA
Hübsch aufbereitete Zahlen ergänzen eine Story im Idealfall nicht nur, sondern bereichern sie: Im Kampf um Leser setzen Leitmedien verstärkt auf Datenjournalismus. Nicht immer hilft das einer Geschichte – und längst nicht jeder Datenfriedhof erweist sich als sprudelnde Infoquelle.
Auf den ersten Blick waren die Zahlen zu Sachsens letzter Landtagswahl ein Traum für Christina Elmer: Bei der mit 40,2 Prozent historisch niedrigen Wahlbeteiligung schwankten die Zahlen der Gemeinden zwischen 40 und 80 Prozent. Einzelne Regionen und Dörfer als Hochburgen der Demokratie mitten im wahlmüden Sachsen? Bestehen etwa Zusammenhänge zwischen Wahlbeteiligung und Faktoren wie beispielsweise Arbeitslosigkeit? So schön die Geschichte auch gewesen wäre – wahr war sie nicht.
Denn in einer Fußnote entdeckte Spiegel-Online-Redakteurin Elmer den Vermerk, dass Stimmen von Briefwählern nicht immer deren Wohnort, sondern den Gemeinden, in denen sie ausgezählt wurden, zugerechnet wurden. Theoretisch hätte eine Ortschaft damit sogar eine Wahlbeteiligung von mehr als hundert Prozent verzeichnen können. Die hoffnungsvolle Recherche verwandelte sich mit dieser Erkenntnis für Elmer in Datenmüll: „Wenn ich sage ‚Hier und dort hat die NPD das höchste Wahlergebnis‘, dann will ich das valide, nicht mit Briefwählern der Nachbargemeinden verzerrt.“
Was ist Qualität im Datenjournalismus und wie arbeite ich richtig mit Daten – diese Fragen zogen sich auf der nr-Jahreskonferenz durch die fast zehn datenjournalistischen Workshops und Diskussionen. Mit dem Validierungsproblem ist Chrstina Elmer bei weitem nicht allein: Aus einer kleinen Anfrage an den Bundestag erhielt Sascha Venohr, Leiter Datenjournalismus bei Zeit Online, zwar offizielle Datensätze zu baufälligen Eisenbahnbrücken in Deutschland – die Streckenkilometer waren jedoch in einer ungewöhnlichen Metrik angegeben. Nach „absurden“ Gesprächen mit der Presseabteilung der Bahn über die korrekte Umrechnung der Streckenkilometer fand Venohr schließlich in Eigenregie einen Bahn-Mitarbeiter, der sich ausschließlich damit befasst und ihm weiterhelfen konnte. „Sucht euch einen solchen Seiteneingang, wenn ihr es mit Großkonzernen zu tun habt“, rät Venohr.
Hilfreicher Tipp aus dem Publikum
Wie ärgerlich unsaubere Datensätze seien, darüber sind sich alle Datenjournalisten einig. Ärgerlicher als invalide Daten seien wohl nur Geschichten, zu denen sich einfach keine aktuellen Daten finden ließen, sagte der Wissenschaftsjournalist Volker Stollorz. Gerade im Gesundheitssystem stoße er häufig an Grenzen, was aktuelle Zahlen anbelange. Ein hilfreicher Tipp kam dafür aus dem Publikum des Panels über gescheiterte Datenprojekte: Finde man eine Gesamtzahl, müsse es dafür auch Eingangsdaten geben – und die müsse man als Journalist eben konsequent einfordern.
Helfen können bei komplizierteren Recherchen auch internationale Kooperationen. Besonders erfolgreich agiert in diesem Bereich seit einigen Jahren das International Consortium of Investigative Journalists (ICIJ), in dem Journalisten aus mehr als 65 Ländern aktiv sind. Die spanische Redakteurin Mar Cabra sprach stellvertretend für das ICJI, das sich vor allem mit Recherchen zu Steueroasen einen Namen gemacht hat, über das internationale Recherchenetzwerk. Wichtig sei, Daten zuerst zu strukturieren und zugänglich zu machen. Beim Projekt Luxembourg Leaks sei das keine leichte Aufgabe gewesen, berichtet Cabra: Mehrere tausend PDFs mussten nach Daten gefiltert werden. Da müsse man mit einer konkreten Frage an den Datensatz herangehen, zum Beispiel: „Wie können wir zeigen, dass Luxemburg ein Steuerparadies ist?“
„Die Daten allein sind nicht die Story“
Mit welcher Erwartung man an Daten herangehen sollte, wurde auch im „Qualitäts-Battle“ diskutiert. Der freie Journalist Björn Schwentker plädierte dafür, kein „Data Crunching“ zu betreiben und Daten besser gezielt mit einer konkreten These oder Frage zu analysieren. Das sei effizienter und würde Qualität sichern. Wenn Daten nicht journalistisch verarbeitet, sondern nur „rausgehauen“ würden, schade das dem Journalismus. Anders sieht das Marco Maas, der regelmäßig Journalisten im Umgang mit Daten schult: Auch das Sammeln, Auswerten und Bereitstellen sei bereits wertvoll. Und Julius Tröger von der Berliner Morgenpost bekräftigte, Datenjournalismus solle nicht nur „Leuchtturmprojekten“ vorbehalten werden.
Datenjournalismus betreiben hieße ja auch vor allem, den Text von zu vielen Zahlen befreien zu können, sagte der schwedische Journalist Nils Muvad, der mit seiner Kollegin Helena Bengtsson vom Guardian über den Nutzen von Daten und Zahlen für journalistische Geschichten sprach. Klar machen müsste man sich, das die besten datenjournalistischen Geschichten sogar ganz ohne Zahlen auskommen könnten, so Muvad. „Wir finden die Story hinter den Daten. Die Daten allein sind nicht die Story.“
Ein bisschen anders sieht das wohl Christina Elmer: Aus den Daten der sächsischen Landtagswahl hat sie nämlich doch noch eine Geschichte gemacht – wenn auch nicht ganz so, wie geplant. Im Blog von Spiegel Online schrieb sie über die absurden Rechercheergebnisse.
Grundlegende Tipps zu Daten und deren Visualisierung:
„Get started with datajournalism“ von Nils Muvad und Helena Bengtsson
Die goldenen Regeln zur Datenvisualisierung von Gregor Aisch (New York Times):
- Nur Balkendiagramme sind langweilig
- Bei Datenvisualisierung gibt es keine Regeln ohne Ausnahmen
- Experimente sind gut
- Jede Form hat Vor- und Nachteile
- Man kann sich leicht verrennen, wenn man nicht mehrere Varianten ausprobiert
- Ignoriere Kritiker
- Dranbleiben!