Kategorie-Archiv: Tutorial

CartoDB: Überblick und Tutorial

Schon länger wollte ich einen kleinen Lobgesang auf CartoDB anstimmen: Ein großartiges Tool, noch dazu Open Source, das sich eigentlich als Standardkartenwerkzeug in Redaktionen längst etablieren haben sollte. Es gibt die gehostete Version, die neben einem kostenfreien Plan auch kostenpflichtige bereit hält. Alternativ könnte eine Redaktion auch selbst die Software auf einem Server aufsetzen – muss dann aber auch über eigenes Kartenmaterial verfügen (siehe dazu: “Verlage und Redaktionen – Investiert in Karten“)

CartoDB ist ungefähr zwei Generationen jünger als das nunmehr in die Jahre gekommene Fusion Tables, mit dessen Darstellungsoptionen man schnell an Grenzen stößt und dessen Look mittlerweile abgegriffen wirkt (Fusion Tables wird, so heißt es, von einer Person bei Google entwickelt).

Das aus Spanien stammende CartoDB, 2012 gestartet, bietet dagegen mitterweile einen mächtigen Funktionsumfang, darunter auch (meiner Meinung nach) eine recht sinnlose Twittervisualisierung, aber auch Animationen (Torque) entlang einer Zeitleiste. Interessant ist auch das zu CartoDB gehörende Projekt Odyssey für “Storytelling” auf Karten.

Weiterlesen

Tutorial: Grenzen, Gebiete und Daten mit Fusion Tables kartieren

Bevölkerungsdichte in Schleswig Holstein nach Landkreisen (Quelle: Stat. Bundesamt)

Die oben stehende interaktive Karte mit Google Fusion Tables zu erzeugen, ist nicht schwer. Wer noch nie mit Fusion Tables (FT) gearbeitet hat, der lese sich bitte aber zuerst das Tutorial zum automatisierten Eintragen von Adressen auf eine Karten mit FT hier im Blog durch, um einige grundsätzlichen Sachen zu erfahren.

Neben Markern kann das Tool auch Gebiete sowie Grenzen darstellen und diese abhängigen von Werten einfärben. Dafür braucht es erst einmal die Gebiete, etwa Bundesländergrenzen als KML-Dateien (Keyhole Markup Language – aus dem virtuellen Globus “Keyhole” wurde 2004 Google Earth).

Beim Bundesamt für Kartographie und Geodäsie gibt es ein Geodatenzentrum (Geodäsie = Wissenschaft von der Ausmessung und Abbildung der Erdoberfläche). Die Kreisgrenzen (und Staatsgebiet, Bundesländer sowie Regierungsbezirke der BRD) finden sich dort zum Download. Zur Nutzung heißt es: “Die nachfolgenden Daten dürfen für private und firmeninterne Zwecke entgeltfrei genutzt werden. Darüber hinaus sind Vervielfältigung, Verbreitung und öffentliche Zugänglichmachung mit nachfolgender Quellenangabe ohne Einschränkungen gestattet, sofern sie unentgeltlich erfolgen.

Weiterlesen

DataWrangler Tutorial – Aus gescanntem Dokument wird eine Tabelle

Wrangler Demo Video from Stanford Visualization Group on Vimeo.

Anhand der Rechenschaftsberichte der Parteien für 2009 wird hier gezeigt, wie sich DataWrangler nutzen lässt. Diese Browser-Anwendung der Universität Standford erlaubt eine Echtzeitmanipulation von Datensätzen mittels einer grafischen Benutzeroberfläche. Es ist ein etwas kompliziert anmutendes Tool – aber es lohnt sich damit zu beschäftigen, da es viel Datenarbeit ersparen kann.

Vor zehn Tagen veröffentlichte taz.de zwei Werkzeuge rund um Parteispenden, die wir von OpenDataCity umgesetzt haben. Einmal eine interaktive Karte der Spender für 2009 über 10.000 Euro sowie ein Recherchetool für die 6700 Spenden über 10.000 Euro in den Jahren 1994 bis 2009. Das ist nur die Spitze des Eisberges; bei manchen Parteien machen die undokumentierten Spenden unter 10.000 Euro die Hälfte der gesamten Finanzen aus. Mehr dazu in diesem taz-Kommentar.

Eigentlich hätte das alles schon viel früher erscheinen sollen; die Vorbereitungen dafür liefen schon seit Ende vergangenen Jahres. Doch dann kamen die Umwälzungen in Nordafrika sowie der Tsunami und die GAUs von Japan dazwischen. So rutschte die Geschichte immer weiter nach hinten und das Pech wollte es, dass Spiegel Online ausgerechnet eine Woche früher ebenfalls eine Parteispendenvisualisierung anbot. Die ist recht gelungen und funktional. Glücklicherweise konzentriert sie sich auf Großspenden über 50.000 Euro und bietet nur die Zahlen ab 1998 auf. Auch stellt SPON – entgegen der taz – die grundlegenden Daten nicht zur Weiterverwendung zur Verfügung (hier finden sich die Daten für 1994 bis 2009).

Weiterlesen

Journalistenhanduch Universalcode: Kapitel Datenjournalismus

Seit vergangenem Jahr wird an dem Handbuch “Universalcode – Journalismus im digitalen Zeitalter” gearbeitet. Ulrike Langer und Christian Jakubetz hatten 2010 das Vorhaben angeschoben. Anlass war, dass es im deutschsprachigen Raum kein entsprechendes Werk rund um zeitgemäßen Onlinejournalismus gibt. Mittlerweile liegen rund 750 Bestellung des Buches vor und es geht bald in den Druck (24,90 EUR – Kauf per Klick auf den Warenkorb oben rechts im Widget); neben der Printversion wird es auch günstigere elektronische Ausgaben geben. Reich wird damit niemand; Herausgeber wie Autoren arbeiten ehrenamtlich. Aktuelles zum Buch ist bei Christian Jakubetz zu erfahren.

UPDATE (4.8.11): Die derzeitige Version der Vorschau im Widget enthält die unten genannten Artikel nicht mehr.

Zusammen mit Ulrike Langer von medialdigital habe ich das Kapitel über Datenjournalismus verfasst. Es lässt sich im folgenden Widget komplett lesen (ab Seite 10) oder hier in etwas größer und auf Doppelseiten. Ab Seite 37 findet sich der lesenswerte Beitrag von Marcus Bösch über “Mobile Reporting”.

Postfilialen in Berlin auf Karte eintragen: Google Fusion Tables Tutorial

Die Taz hat heute einen Datensatz über Postfilialen bzw. Verkausstellen der Post in Berlin veröffentlicht. Per Google Fusion Table wurden die Standorte der (Ex-Filialen) auf einer Karte eingetragen und in den Artikel eingebunden. Im Folgenden wird erklärt, wie diese Kartierung – siehe eingebundene Karte oben – umgesetzt wurde.

Weiterlesen

Tutorial: Interaktive Kartenvisualisierung mit “Many Eyes” am Beispiel rechter Straftaten

Ausschnitt Karte Deutschland Many Eyes rechte Straftaten Mai 2010

In diesem Tutorial wird gezeigt, wie sich Daten mit der Websoftware Many Eyes von IBM darstellen lassen. Besonders die Möglichkeit Informationen nach Bundesland auf einer Deutschlandkarte abzubilden, macht den Dienst äußerst attraktiv (und bislang wohl einmalig, zumindest was kostenlose Webdienste angeht). Wie das funktioniert, wird im Folgendem gezeigt. Aber auch Bubblecharts, Treemaps usw. sind mit Many Eyes möglich – erfreulicherwerweise lassen sich die interaktiven Darstellungen auf der eigenen Seite einbetten.

Rechte Straftaten im Mai 2010 – bundesweit:

Gut 1.300 Straftaten von Rechten führten im Mai 2010 laut Bundesregierung zu einem (1) Haftbefehl – bei gut 600 Tatverdächtigen. Fast 90 Menschen wurden durch die rechte Gewalt verletzt.

Dass es bei den doch recht vielen offensichtlichen Körperverletzungen zu nur einem Haftbefehl gekommen ist, ist doch sehr erstaunlich.

Datensatz erstellen

Die Informationen gehen aus einer Antwort der Bundesregierung (pdf) aus dem Juli 2010 hervor: Weiterlesen

Yahoo Pipes und Twitterfeed-Tutorial: Bundestag-RSS filtern

yahoo pipes schemaYahoo Pipes ist ein großartiges Werkzeug, um Informationen von Websiten oder aus anderen Datenquellen abzugreifen, zusammenzuführen und automatisiert zu filtern. Es benötigt keine großartigen Programmierkenntnisse, sondern erlaubt logische Operationen über eine grafische Oberfläche. Die so gewonnen Informationen können dann in verschiedenen Formaten veröffentlich werden (Mashup). Eben ist das Werkzeug, für dessen Nutzung ein Yahoo-Account benötigt wird, in der zweiten Version erschienen. Das Update nach drei Jahren soll schneller arbeiten und demnächst neue Funktionen erlauben, heißt es im offiziellen Blog.

Hier wird im folgenden Beschrieben, wie aus dem RSS-Feed der Bundestagswebsite alle Drucksachen, die Anfragen an und Antworten der Bundesregierungen sind, herausgesiebt werden. Weiter wird gezeigt, wie sich die Links auf das pdf-Dokument automatisch auf Twitter (twitter.com/anfrage) veröffentlichen lassen.

Wofür ist das nützlich? Nur ein kleiner Teil der Drucksachen des Bundestages sind Anfragen der Opposition bzw. Antworten der Bundesregierung auf  diese (ein anderes zu filterndes Thema wären bspw. die “Anträge). Die Anfragen selbst enthalten nicht selten interessante Informationen; die Antworten wiederrum verraten einiges über Regierungshandeln – nicht zuletzt durch die Verweigerung von Informationen. Insofern zeigt das im folgenden erklärte Verfahren ein Weg zur Arbeitserleichterung in der Recherche und dem Monitoring auf – an der alle teilhaben können, die ein RSS-Reader nutzen oder sich über Twitter mit Informationen versorgen.

Weiterlesen

Motion Charts-Tutorial: Afghanistan und Bundeswehrlogistikkosten

Wie hoch sind die Kosten des Kriegs in Afghanistan? Auf eine diesbezügliche kleine Anfrage der Fraktion hat Tom Strohschneider in seinem Freitagblog aufmerksam gemacht (in den Kommentaren dort geht es bspw. um die Validität der Daten). Auf die Anfrage von der Partei Die Linke im Bundestag hatte es unlängst eine Antwort der Bundesregierung (pdf – Drucksache 17/2026) gegeben. Sie enthält zahlreiches statistisches Material, etwa über die Anzahl und Typen des militärischen Geräts – darunter beispielweise einige dutzend Flugdrohnen.

Im Folgenden werden die Kosten für die Logistikdienstleistungen, die seitens der Bundeswehr extern vergeben werden, genauer betrachtet. Dafür wurden die Daten aus dem pdf extrahiert, in eine sinnvolle Datenstruktur gebracht und dann mittels Googles Texte&Tabellen (Docs) in einer interaktiven Motion Chart (Bewegungsdiagramm) visualisiert (siehe oben). Die einzelnen Arbeitsschritte dafür werden weiter unten erläutert. Der genutzte Datensatz findet sich hier.

Was kann Daten(bank)journalismus nun mit diesen statistischen Informationen anfangen? Die grundsätzliche Frage des Journalisten an ein Thema lautet: Welche Geschichte gibt es zu erzählen? Der Ansatz des data-driven journalism ist die Annahme, dass in den Daten Geschichten verborgen sind; die können computergestützt gehoben werden und anhand der so neu entstehenden Datensätze selbst können die entsprechende Geschichten erzählt werden.

Weiterlesen