Das Prozentzeichen oder Fallstricke beim Datenjournalismus

Zeit Online hat merklich die Taktzahl hochgedreht. Alle paar Wochen erscheint nun eine datenbasierte interaktive Infografik. Das dürfte u.a. auch daran liegen, dass dort neuerdings der Programmierer Cole Gillespie arbeitet - er ist dort im Rahmen der “Knight Mozilla News Technology Fellowship” tätig.

Gestern erschien nun bei Zeit Online (ZOn) das “Regierungsbarometer“.

ZOn musste schon für die beiden letzten Grafiken Kritik einstecken – einmal hier im Blog in Sachen Fußball und dann beim Kollegen Björn Schwentker in Sachen Demographie. Und auch die jüngste Geschichte ist diskussionswürdig.

Vorweg: Es geht hier nicht um ein ZOn-bashing – dort wird entgegen der meisten anderen Medien immerhin an datenjournalistischen Methoden gefeilt. Mangels anderer Akteure im Bereich des deutschsprachigen Datenjournalismus kann sich zur Zeit aber letztlich nur an ZOn-Werken abgearbeitet werden.

Jetzt zur Sache – es herrschte Verwirrung:

 

 

 

Das Problem des Ganzen ist nicht die Umsetzung. Sowohl technisch als auch vom Interface her ist das Angebot gut gemacht. Hilfreich sind beispielsweise die roten Markierungen auf den Graphen, die Kontext zu historisch/politischen Zusammenhängen bieten und ggf. den Verlauf der Kurve erklären könnten. Wer redaktionell für die Auswahl dieser Texte verantwortlich ist, ist allerdings nicht ersichtlich. Ist es die Politikredaktion, Entwicklungsredaktion oder sonst wer?

Das Problem fängt bei einem kleinen Zeichen an: dem Prozentzeichen in der y-Achse. Dort wird das “Government Approval Rating” (GAR) des Umfrageinstituts YouGov gezeigt. Inwiefern solch eine tägliche Umfrage Sinn macht, sei dahingestellt. ZOn selbst schreibt: “Welche Ereignisse für die Meinung der Deutschen über ihre Regierung tatsächlich entscheidend sind, und ob sich diese dann konkret auf die Umfragen auswirken, ist allerdings Interpretationssache. Denn YouGov fragt die Bürger nicht nach Gründen für ihre Zufriedenheit oder Unzufriedenheit.

Gefragt wird jedenfalls: “‘Sind Sie mit der Leistung der Bundesregierung zufrieden?’ Die Antwortmöglichkeiten: ‘Ja’, ‘Nein’ und ‘Weiß nicht’.

Das GAR wird laut ZOn so errechnet: “Sind beispielsweise 80 Prozent der Befragten unzufrieden und 20 Prozent zufrieden, ergibt das einen Wert von -60.”  Aus dieser “-60″ wird in der Grafik ein “-60%”. Prozent müssen aber immer zwischen 0 und 100 liegen.  Letztlich steht dort etwa: Die Deutschen sind zu -62% unzufrieden mit ihrer Regierung. Das ist einer der Gründe, der zu der oben dokumentieren Verwirrung führt. (UPDATE 02.04.2012: ZOn hat mittlerweile das Prozentzeichen entfernt.)

Für Missverständnisse sorgt das Prozentzeichen auch, weil Frauen offenbar durchgängig rund 10 “Prozent” unzufriedener sind, als Männer. Das rührt daher, dass mit einem doppelten Wertebereich gearbeitet wird (+100 bis -100) – die Abweichung also eher 5 Punkte ist.

Weiter ist unklar, was mit den Antworten “Weiß nicht” geschieht. Werden die eingerechnet? Werden sie ignoriert? Es könnte jedenfalls sein, dass die Unentschiedenheit sowohl bei den in der Grafik möglichen Vergleichen nach Geschlecht sowie nach Ost-West eine Rolle spielen könnte.

Eins noch: Im Eingangstext zur Grafik wird zwar erwähnt, dass die Werte nur werktags erhoben werden – in der Grafik selbst wird aber nicht deutlich, dass die Werte wohl für Wochenenden/ Feiertage interpoliert werden. Leider werden die Rohdaten nicht mitveröffentlicht, was zum Verständnis hätte beitragen könnten. Wahrscheinlich liegen die Gründe im Vertraglichen mit YouGov.

ZOn hätte die gestiftete Verwirrung vermeiden können. Von außen betrachtet scheint es so, als ob offenbar nicht ausreichend getestet wird, inwieweit die Anwendungen für die Benutzer verständlich sind. Das ist aber ein Muss bei Softwareentwicklung – und interaktive Grafiken sind letztlich Software.

Zum Abschluss ein Vorschlag: Neben der oben in einem Tweet erwähnten alternativen Darstellungsweise im Blog eagereyes wäre in meinen Augen die unten skiziierte Grafik weniger verwirrend: Die Nullline trennt Zufriedene (blau) von Unzufriedenen (rot). Dort müsste nur angegeben werden, dass die fehlenden Werte zu insgesamt 100 auf die Antwort “weiß nicht” zurückzuführen sind.

 

Ein Gedanke zu „Das Prozentzeichen oder Fallstricke beim Datenjournalismus

  1. Pingback: Sonntags-Surftipps (4): Aprilscherze, Teleprompter und die Tücken des Datenjournalismus | Martin Hoffmann

Hinterlasse eine Antwort

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *

Du kannst folgende HTML-Tags benutzen: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>