Wie Zeit Online mit "Wahlistik" Stimmung macht

Es ist nicht Verkehrtes daran, von erfolgreichen Konzepten zu lernen. Zeit Onlines „Wahlistik“ ist offensichtlich von Nate Silvers viel gelobter Statistikauswertung zur vergangenen US-Präsidentenwahl für die NYT inspiriert. Nun ist es in einem de facto Zweiparteien-System einfacher Vorhersagen zu treffen, als in einem Vielparteien-System wie in Deutschland.

Zeit Online hat ein Verfahren mit Statistikern der Uni München entwickelt: Es nimmt die Durchschnittswerte der jeweils aktuellsten Umfragewerte von vier Instituten als Ausgangsgrundlage. 10.000 Mal werden dann Ergebnisse generiert, die von den Ausgangswerten im Rahmen statistischer Ungenauigkeit zufällig abweichen. Bspw. können in 3524 der simulierten Fälle CDU/CSU und FDP mit ihren erreichten Sitzen eine Koalition bilden. Das wird als 35% Wahrscheinlichkeit für die Möglichkeit einer Koalitionsbildung Schwarz-Gelb gewertet. Da derzeit trotz simulierter Abweichung Schwarz-Rot und Schwarz-Grün 10.000 Mal möglich sind, erhalten beide Koalitionsoptionen jeweils 100%.

Vielleicht wäre es ratsam gewesen, die Methode auch in einem wiederverwendbaren Schaubild oder in einem Erklärvideo darzulegen. Bis ich jedenfalls verstanden habe, was genau Zeit Online überhaupt mit der Wahlistik sagen will, musste ich mir erst einmal den Kopf zerbrechen. Das liegt zum einen an solch einer Überschrift nebst Vorspann:

Bildschirmfoto 2013-08-17 um 10.05.29
Das ist mindestens missverständlich formuliert: Richtiger wäre die Überschrift, wie es auch im letzten Satz des Vorspanns steht: „Welche Koalition ist am möglichsten?“ Wahrscheinlichkeit und Möglichkeit sind zwei grundverschiedene Dinge. Die Wahlistik kann eben nur zeigen, wie hoch die Chancen für verschiedene Konstellationen von Koalitionen sind, zustande zu kommen.

Auch diese in der Serie wiederkehrende jeweils aktualisierte Grafik hilft nicht weiter: Sie ist mit „Rechnerische Wahrscheinlichkeiten der Koalitionen“ überschrieben. Hier der Stand vom 16.8.2013:

Bildschirmfoto 2013-08-17 um 10.33.21

Wie Zeit Online mit "Wahlistik" Stimmung macht weiterlesen

Datenpopulismus

Bildschirmfoto 2013-07-23 um 09.32.50

Anfang des Monats machten wir ein Experiment. Wir von OpenDataCity hatten seit Tagen schon an einer Webapp zu Prism/Tempora gearbeitet. Unser Eindruck war, dass das Thema „untervisualisiert“ war; gleichzeitig aber Visualisierungen in dem stark technisch geprägten Komplex von Nutzen sein könnten. Bei den Überwachungssystemen geht es erst einmal um Daten – was liegt näher, als sich ihnen per Datenjournalismus zu nähern?

Die App, die anhand einiger Beispiele mittels des Tools „Traceroute“ zeigt, wie Internetanfragen durchs Netz geleitet werden, war fast fertig. Die Idee, der von wenig Sachverstand geprägten Aussage des Bundespräsidenten, der einen Vergleich von Stasi und NSA kategorisch von sich wies, etwas entgegenzusetzen, kam recht spontan. Innerhalb weniger Stunde war eine App fertig. Sie vergleicht letztlich nur zwei Zahlen: Nämlich die Möglichkeiten der Speichermengen der Geheimdienste. Am frühen Abend des Donnerstages (4.7.2013) veröffentlichten wir „Stasi vs NSA“ und zwei Stunden später „Prism/Traceroute“.

Bald bezeichneten wir die Stasi vs NSA-Webapp intern als „Datenpopulismus“. Sie ist mittlerweile – vor allem weil wir die App zum Einbetten anbieten – fast 500.000 Mal geklickt worden (siehe Graph oben). Etwa Achtmal soviel, wie die Traceroute-Geschichte. Das zeigt eindrücklich, dass Datenboulevard funktionieren kann. Zumindest wenn es um die „Eyeballs“ geht, also Klicks generiert werden sollen.

Datenpopulismus weiterlesen

Land unter beim Onlinejournalismus – Verpasste Chancen beim Hochwasser

Hin und her gingen die Überlegungen. Wäre „Deichbruch am Bildschirm“ nicht passender gewesen oder noch origineller „Im Web im Regen stehen gelassen“? Aber es geht ja nicht um einen Wettbewerb in dämlichen Überschriften, sondern um eine Bestandsaufnahme: Wie wird das Hochwasser, das seit zehn Tagen bestimmendes Thema in Deutschland ist, von den „Qualitätsmedien“ im Netz erzählt und berichtet?

Kurz zusammengefasst: Entäuschend. Bildstrecken, Texte, kärgliche Infografiken. Dabei sind die Nachrichten voll mit Namen von Orten, Flüssen und Deichen. Aber wo sind die? Welchen Gebieten droht in absehbarer Zeit Hochwasser? Wann kommt die Scheitelwelle? Was wurde überflutet, welche Schäden wurden angerichtet?

Eigentlich ein Fest für Datenvisualisierung. Man denke nur an Werke wie den Storm Tracker. Oder interaktive Grafiken der NYT rund um Unwetter und Naturkatastrophen (die NYT hat immerhin eine Karte mit überfluteten Gebieten in Dtl.). Inspiration gibt es genug. Und noch dazu gibt es Daten. Pegel Online veröffentlicht faktisch Open Data, also frei verwendbare Daten über die Pegelstände. Sogar per Schnittstelle, API.

Land unter beim Onlinejournalismus – Verpasste Chancen beim Hochwasser weiterlesen

Datenjournalismus im Mai 2013

Eine Auswahl von Links, Materialien, Tools und Termine

Bildschirmfoto 2013-06-06 um 16.57.17

Eine Zeitleiste, die bis zu den Anfängen der Menschheitsgeschichte reicht, zeigt Meilensteine der Visualisierung (s.o.).

Nicht alle teilen die Begeisterung über Hochglanz-Slideshows wie Snowfall oder Firestorm. Neben inhaltlicher Kritik äußert Choire Sicha vor allem Bedauern, dass sich wieder das mehr Öberflächliche gegenüber dem faktenbasierten „Nate Silver model“ in der Debatte über die Zukunft des Journalismus durchgesetzt zu haben scheint. (In dem Zusammenhang: siehe auch die Parodie „Icefall„)
Datenjournalismus im Mai 2013 weiterlesen

Volkszählung #zensus2011: Vorschau auf die Zensuskarte

Die Zensuskarte hat etwas von einem Experiment.

Morgen, Freitag um 11 Uhr, veröffentlichen die Statistischen Ämter die erste Marge an Daten der im Jahr 2011 durchgeführten Volkszählung. Die erste seit 1987(BRD) bzw. 1981(DDR). Es geht dabei auch um viel Geld; z.B. die Bemessungsgrundlage des Länderfinanzausgleichs, die auch auf Einwohnerzahlen beruht.

Im Auftrag der Bundeszentrale für politische Bildung haben wir von OpenDataCity das Angebot zensuskarte.de entwickelt. Dort steht eine Vorschau bereit Mittlerweile läuft die Karte – sie ist noch recht Beta; wird nach und nach mehr Funktionalität bieten.

Die Anwendung ist unter CC:by lizenziert und erlaubt allen das Einbetten von Karten – siehe oben.

Die Idee ist: Morgen so schnell wie möglich, die Daten des Zensus in die Karte einfließen zu lassen. Das Experiment macht aus, dass nur ungefähr bekannt ist, wie genau die Daten darherkommen. Zwar wurde eine Shapefile, also die Grenzen der Gemeinden, von Anfang 2011 zur Verfügung gestellt. Aber ob sich die Daten für die gut 11.000 Gemeinden einfach hineinpassen lassen, bleibt abzuwarten.

Aktuelle Infos gibt es dann morgen auch auf Twitter unter @zensuskarte.

[Update: Die Vorschau ist von der Einfärbung her nicht sehr schlau – sie zeigt die absoluten Einwohnerzahlen; besser wären bspw. Einwohner pro Quadratkilometer. (Jetzt zeigt die Karte wirkliche Zensusdaten). Siehe dazu Take Care of your Choropleth Maps]

Volkszählung #zensus2011: Vorschau auf die Zensuskarte weiterlesen

re:log: Hintergrund zur Auswertung der W-LAN-Nutzung auf der re:publica 2013

In der Anwendungen lassen sich Gruppen markieren und über die Zeit verfolgen
In der Anwendungen lassen sich Gruppen markieren und über die Zeit verfolgen

Rund 100 Access-Points sorgten für die Netzabdeckung im Veranstaltungsort „Station“ in Berlin. Wann ein Gerät sich während der re:publica 2013 bei welchem Zugriffspunkt anmeldete, wurde festgehalten und diese Daten nutzt unsere Web-App re:log. Wir bekamen von den re:publica Veranstaltern einen pseudonymisierten Datensatz. Da die Macher einen detailliertes Mitschneiden des W-LAN nicht angekündigt hatten – etwa die Aufzeichnung der gesamten Hardware/MAC-Adressen oder des Traffics auf einem Gerät – kann aus Datenschutzgründen nur der Aspekt Verbindungsdauer und -ort ausgewertet werden.

Fürs kommende Jahr, so wird angekündigt, wolle man aber „ gerne vom ‚Aluhut-‚ in den ‚Spackeria-Modus‘ wechseln“ und eine tiefergehende Analyse ermöglichen. re:log: Hintergrund zur Auswertung der W-LAN-Nutzung auf der re:publica 2013 weiterlesen

Datenjournalismus im April 2013

Eine Auswahl von Links, Materialien, Tools und Termine

Bildschirmfoto 2013-05-04 um 08.28.53

Ein Mammutprojekt: Unter Leitung von Julius Tröger hat die Berliner Morgenpost den Flugverkehr über Berlin visualisiert. Die 3D-Ansicht ist sehenswert. Sie zeigt, welche Lärmbelastung für eine jeweilige Adresse anfällt. Ein weiteres Beispiel für die Nachhaltigkeit von Datenjournalismus: Die Anwendung bleibt aktuell und zieht neueste Daten automatisiert ein. Hintergründe finden sich hier im making of.

Die Flugroutengeschichte ist eines der 72 Projekte, die für den internationalen Data Journalism Award nominert wurden. Die Preisverleihung ist Mitte Juni in Paris. Auch unter den Nominierten beim Grimme-Online-Award finden sich einige datenlastige oder gar datenjournalistische Projekte. Am 21. Juni werden dafür die Preise vergeben.

Was der Wechsel der Chefredaktion bei der Spiegel/SpOn für den Datenjournalismus dort im Haus bringen wird, muss sich noch zeigen. Jedenfalls gibt es dort nun das Blog „Datenlese„. Auch ist gerade die Datenjournalistin Christina Elmer vom Investigativ-Ressort des Sterns zu SpOn gewechselt.

Datenjournalismus im April 2013 weiterlesen

Es fehlt an Ausbildungsmöglichkeiten für Datenjournalismus

Trifft ein Journalismustrainer einen anderen. Bericht der eine: „Frag‘ ich die Studierende, was wollt ihr denn später im Journalismus machen? Und nicht wenige sagen, Seite 3 in der SZ oder FAZ schreiben.“ Schüttelt der zweite den Kopf: „Ja, dann frag‘ sie mal, wie viele von ihnen ein Zeitungsabo haben.“ „In der Regel keiner“, antwortet der erste. Beide lachen.

Zeitungsreporter ist der schlechteste Job, den man in den USA zur Zeit anstreben kann. Holzfäller und Militärangestelle kommen auf Platz 2 und 3 der Studie eines Jobportals, das solch ein Ranking seit vielen Jahren anbietet und Kriterien wie Einkommen, Aufstiegschancen und Stress anlegt.

Die sogenannte Zeitungskrise in den Vereinigten Staaten spielt zwar in einer anderen Liga, aber auch hierzulande sind die rosigen Zeiten längst vorbei. Die IVW-Zahlen für das erste Quartal 2013 geben eine Ahnung davon, dass die gedruckte Zeitungslandschaft in Deutschland in naher Zukunft weiter schrumpfen dürfte.

Die eingangs geschilderte Unterhaltung zeigt die seltsame Lage: Diejenigen, die heute Journalismus lernen, sind geprägt von Klischees, Vorbildern und Legenden, die ihnen in der Realitität ihres zukünftigen Berufsfeldes wenig bis gar nicht begegnen werden. Es ist das Dilemma, dass sie nicht selten Ausbildern gegenüber sitzen, die ebenfalls von diesen Bildern in ihrem Selbstverständnis geprägt sind und alten Zeiten hinterhängen.

Der Pariastatus, aus dem sich Onlinejournalismus nur langsam lösen kann, hat nicht zuletzt für Leerstellen in der Ausbildung gesorgt. Ausbildungswege in diesem Bereich hecheln, wenn überhaupt, der rapiden Fortentwicklung des Netzes hinterher. In den USA dagegen verlassen demnächst die ersten Absolventen des Studiengangs „Journalism & Computer Science“ die Columbian Journalism School.

Es fehlt an Ausbildungsmöglichkeiten für Datenjournalismus weiterlesen

Aufruf zur Mitarbeit: Open ARD ZDF

open_ard_zdf1

Die öffentlich-rechtlichen Sender werden in weiten Teilen von der Allgemeinheit finanziert. Wie die Gelder, die neuerdings über den GEZ-Nachfolger „Beitragsservice“ eingesammelt werden, ausgegeben werden, ist nur unzulänglich bekannt. Eine demokratische Kontrolle findet nur indirekt statt, über Rundfunkräte etc.. Der Bürger und Souverän wird im unklaren gelassen.

Unter „öffentlich“ lässt sich allerdings etwas anderes verstehen. Nämlich öffentlich im Sinne von „Open“, also einem freien ungehinderten Zugang.

Um der Intransparenz etwas entgegen zu setzen, startet nun eine auf Langfristigkeit angelegte Arbeitsgruppe „Open ARD ZDF“. Die wird sicherlich einige Jahre brauchen, um zum Erfolg zu kommen. Die dicken Bretter von Institutionen zu bohren, braucht seine Zeit.

Wer konstruktiv mitarbeiten möchte ist herzlich willkommen. Dieses Etherpad dient als erste Arbeitsgrundlage, dort findet sich erstes Material und man kann sich als Mitarbeiter/in eintragen. Ob sich das ganze über eine Google-/Facebookgruppe oder Mailinglist organisiert, wird sich finden. (UPDATE: Hier geht es zur Mailingliste Doodle-Umfrage). Kontakt: openardzdf-at-opendatacity-de

Ziel der Arbeitsgruppe

Bei den weitgehend von der Allgemeinheit finanzierten öffentlich-rechtlichen Sendern detaillierte Transparenz bei den Ausgaben zu schaffen.

Die Zahlen und Vorgänge sollen so aktuell wie möglich strukturiert als Open Data für alle sichtbar, zugänglich und abrufbar sein.

Es geht um ARD, ZDF, Deutschlandradio/-funk. Dazu gezählt wird auch die Deutsche Welle (die hauptsächlich aus dem Haushalt des Kanzleramts getragen wird).

Beim Ganzen gibt es auch einiges zu lernen: Darüber, wie der ÖR organisiert ist und wie Datenrecherche betrieben werden kann.

Nächste Schritte

  • Überblick verschaffen über vorhandenes Datenmaterial
  • Daten aus pdf extrahieren, strukturieren, veröffentlichen
  • weiteres Vorgehen planen, nachdem klar ist, welche Zahlen/ Daten relevant sind bzw. benötigt werden
  • entsprechende Ansprechpartner/Stellen/Zuständigkeiten identifizieren
  • möglicherweise Crowdfunding für IFG-Anfragen (Informationsfreiheitsgesetz) usw.
  • Klärung, ob Transparenz über Rundfunkänderungsstaatsvertrag regelbar ist

Was die Bundeswehr in den Berichten an die Öffentlichkeit alles weg lässt

vergleich_klein
Laut dem Sprecher des Verteidigungsministeriums würden sie die Berichte über die Einsätze der Bundeswehr selber leaken, nämlich als „Unterrichtung der Öffentlichkeit“ (UdÖ, seit Anfang 2011). Warum dann wegen angeblicher Urheberrechtsverstöße gegen die WAZ vorgegangen wird, bleibt unklar. Im vergangenen Jahr hatte die Zeitung die „Unterrichtungen des Parlaments (UdP, 2005-2012) veröffentlicht. Diese Berichte unterliegen der geringsten Geheimhaltungsstufe „Verschlusssache“ und sind für den Verteidigungssauschuss des Bundestages gedacht.

Wir von OpenDataCity hatten der WAZ bei der Aufbereitung und Darstellung der UdP geholfen und haben die Aussage des Sprechers an einem Beispiel überprüft.

Die  grünen Textpassagen der Illustration rechts (hier eine Großansicht) zeigen die Übereinstimmungen in beiden Berichten – die roten sind die Teile, die nur in der UdP stehen. Es handelt sich um die Ausgaben:

UdP 11-30 und

UdÖ 11-24 (pdf)

Die Bundeswehr begann erst Mitte Februar 2011 mit der Unterrichtung der Öffentlichkeit, deswegen die unterschiedliche Nummerierung. Informationen über Auslandseinsätze vor dem Jahr 2011 bleiben weiterhin geheim.

Welche Informationen der Öffentlichkeit vorenthalten werden, lässt sich am folgenden Beispiel gut erkennen. In der „Unterrichtung der Öffentlichkeit“ (Ausgabe 11-24 Seite 2) steht:

Im Zeitraum vom 18.07.11 bis 24.07.11 (29. KW) registrierte ISAF landesweit über 700 Sicherheitsvorfälle. Es handelte sich um Schusswechsel und Gefechte, Sprengstoffanschläge sowie Vorfälle von indirektem Beschuss (Mörser und Raketen) und sonstige Vorfälle.

Der Absatz ist gegenüber der „Unterrichtung des Parlaments“ (11-30 Seite 4) sehr ähnlich, nur dass die Kennzahlen entfernt wurden:

ausschnitt

Die Frage ist, ob diese Informationen aus Gründen der Geheimhaltung, aus urheberrechtlichen Gründen oder aus politischen Gründen entfernt wurden.


Die Illustration steht unter einer CC-BY-Lizenz (CC-BY OpenDataCity/Michael Kreil)