Die Vermessung des TV-Programms

Das „TV Meter“ – ein nicht realisiertes Datenjournalismusprojekt aus meiner Schublade

Gefühlt besteht das Angebot des öffentlich-rechtlichen Fernsehens aus Quizshows, Krimis, Sport und Schlagersendungen plus etwas Nachrichten, Politiksendungen sowie Talkshows.

Derlei Gefühle ließe sich recht einfach mit Zahlen unterfüttern: Das Fernsehprogramm kommt seit eh und je in Tabellenform daher. Vor allem die ARD macht es einfach, ihr Programm auszulesen:

http://programm.ard.de/TV/Programm/Sender?datum=09.01.2018&hour=0&sender=28106

Unter dieser URL findet sich das Programm der ARD für einen Tag. Die Struktur der URL macht deutlich, dass es simpel sein dürfte, zurückliegende Tage bzw. zukünftige aufzurufen. Offenbar scheint das komplette Programm über den Parameter „datum“ seit 2011 und 40 Tage im Voraus abrufbar zu sein.

Auch deutet der Parameter „sender“ in der URL an, dass sich andere Sender abrufen lassen: Neben allen 3. Programmen finden sich auch die Programme von Phoenix, arte, Kika, One, ARD-alpha und tagesschau24.

Jede Sendung bringt diverse zusätzliche Informationen mit. Neben Produktionsjahr und Beginn findet sich eine Kategorisierung – der Tatort etwa ist in „Film“, „Fernsehfilm“ und „Krimi“ eingeordnet, was im Abschnitt „Ähnliche Sendungen“ steht (die Kategorien gibt es ab dem Jahr 2014). Solch ähnliche Sendungen, auch von anderen Sendern aus dem Senderverbund, sind dann einzelned per Link aufrufbar; jede Sendungen hat eine eigene ID, z.B. http://programm.ard.de/?sendung=28205425650933. Ggf. findet sich den Details zu der Sendung in tabellarischer Form die Besetzungsliste inkl. Regie, Kamera, Buch und Musik; Schauspieler haben eine eigene Profilseite, z.B. http://programm.ard.de/Programm/Starguide?detailsuche=1&mitwirkende=Meret+Becker

Leider kein Open Data

Sprich: Die ARD nutzt eine gut strukturierte Datenbank, die hinter ihrem Programmdarstellung im Web liegt; es wäre ein leichtes für die Fernsehanstalt, diese offen zugänglich und dokumentiert als API (Schnittstelle) anzubieten. Warum solch Open Data weiterhin nicht zum Grundprinzip der von der Allgemeinheit finanzierten öffentlich-rechtlichen Sender gehört, ist blamabel.

So oder so: Die Struktur des Webangebots der ARD macht es verhältnismäßig einfach, die Datenbank systematisch auszulesen (zu scrapen). Neben den tatsächlichen Anteilen von Sport, Krimis usw. am Programm – auch im Vergleich zu den vergangen Jahren – ließe sich auf für Schauspieler und Moderatoren Daten erheben. 

Möglich wäre zu messen, wieviel des Programms aus Eigenproduktionen und wieviel es aus Wiederholungen besteht. Weiter ließen sich diese Daten mit den Einschaltquoten (die ARD veröffentlicht die im Detail für den Vortag) sowie mit den Kosten pro Sendeminute (soweit bekannt, siehe hier, hier und die KEF-Berichte) verbinden.

Das ZDF bietet sein Programm (inkl. Info & Neo sowie Partnersender) in einer Tabelle – horizontal zum Scrollen – unterhalb des Live-Streams an. Ein Blick in den HTML-Quelltext zeigt, dass die Programmdaten auch hier klar strukturiert sind und somit einfach scrapebar. Allerdings scheinen die Sendungen nicht so gut mit Schlagworten versehen und die Details zum Teil dürftiger zu sein. Die ZDF-Einschaltquoten lassen sich im Detail über die Marktanteil-Tafeln im „Teletext“ abrufen.

EPG (Electronic Programme Guide)

Eine andere mögliche Datenquelle ist der EPG (Electronic Programme Guide). Diese Datenbank befeuert bspw. die Programmansicht, die direkt in neueren TVs eingeblendet werden kann. Unter epgdata.com lässt sich der Zugang zur EPG-Datenbank im XML-Format für ein Jahr für 18 Euro erwerben. Sie enthält auch die Daten vieler Privatsender, auch aus anderen Ländern (insgesamt knapp 190 Sender). Anbieter der Daten ist „Hörzu“; die Details und Struktur der EPG-Daten lässt sich auch im Web betrachten.

Mit solch Daten zum TV-Programm ließe sich fortlaufend über das Fernsehprogramm auf andere Weise berichten; es ließe sich der „Puls“ messen und in angebrachter Weise visualisieren. Die NoBilllag-Iniative in der Schweiz zeigt, unter welchen Rechtfertigungsdruck Öffentlich-Rechtliche o.ä. Einrichtungen geraten können. Eine faktenbasierte Berichterstattung jenseits einer gefühlten Wahrnehmung über die Struktur des Programms von ARD und ZDF dürfte dem Diskurs generell gut tun.

Dieses Konzept schlummerte seit 2013 in meiner „Schublade“. Falls jemand solch ein TV-Meter umsetzen will, würde ich mich freuen. Gerne stehe ich für Fragen und Anregungen zur Verfügung.

6 Gedanken zu „Die Vermessung des TV-Programms“

  1. Hallo

    bzgl. des Auslesens der Sendungsdaten dürften die Macher von MediathekView eine sehr gute Anlaufstelle sein. Im Programm selbst kann man jeden Sender und jede Sendung auf unzählige Varianten filtern.

    Ich selbst habe weder mit MediathekView, noch den Machern hinter dem Projekt etwas zu tun. Bin also nur begeisterter Nutzer der Software.

    Alte und sehr informative Seite des ursprünglichen Entwicklers
    http://zdfmediathk.sourceforge.net/

    Neue Seite, das das Projekt als Community-Projekt weiterführt
    https://mediathekview.de/

    Fork als Browserversion
    https://mediathekviewweb.de/

  2. Hi, ich hab schon länger die Idee im Kopf eine brauchbarere Version der ganzen Online-Sender-Listen zu entwickeln und begebe mich hin und wieder auf die suche nach brauchbaren Datenquellen. Außerdem finde ich die Datenanalyse interessant. Die Idee nach einem TV-Meter klingt wirklich interessant.

    Seit gut 15 Jahren programmiere ich in verschieden Sprachen (hauptsächlich in PHP) und interessiere mich sein einiger Zeit auch für Datenanalyse und Visualisierung. Beeindruckt mich „spiegel online mining“ von david kriesel, (sehr unterhaltsames video bei youtube)
    Ich könnte mir vorstellen, das man bei längerer Beobachtung des TV-Programms und ggf. genauerer Betrachtung einzelner Themen etwas über die gesellschaftliche Wandlung herausbekommen kann.

    Die 18 Euro im Jahr kann man da durchaus mal investieren. Gut wäre nur wenn die Erkenntnisse und ggf. ein gutes „Live-Tool“ für alle anderen Dabei raus springen würde, leider sind die Daten dafür nicht frei gegeben oder?

    Lange Rede kurzer Sinn 🙂
    Wir können uns zu dem Thema TV-Meter gern mal austauschen, ich finde die Idee interessant und ich denke ich bringe zum einen das nötige Technische Knowhow mit und kann sicher noch eine Menge dazu lernen.

  3. So eine Analyse will ich auch seit Jahren immer wieder mal machen. Was man sich halt so vornimmt, nicht nur zu Silvester 😉

    Die Seite der ARD mit dem Programm nach Datum ist eigentlich ein guter Startpunkt. Aber eine Kategorisierung der Sendungen scheint zu fehlen. Das mag beim Tatort und einigen anderen Sendungen anders aussehen, aber ich habe einfach mal einige Stichproben genommen und dort keine Kategorie gefunden.
    Und XML wäre allemal besser, als sich alles aus dem HTML heraus zu fummeln.
    Bei ARTE gab es früher mal XML-Angebote. Keine Ahnung, ob es die noch gibt.

    Falls Du noch einige Links diesbezüglich kennst, lass es mich wissen. Eine Analyse des ARD-/ZDF-Angebots würde mich sehr interessieren. Ich hatte vor einigen Jahren mal von Hand eine Woche ZDF-Programm analysiert. Da war das gefühlte Kochshow-Programm in der Tat auch zu erkennen.
    Das ganze auf eine bessere Datenbasis als eine willkürlich gewählte Woche zu stellen wäre gut.

    Mit Datenjournalismus im Sinne von Journalismus habe ich als Nicht-Journalist nicht viel zu tun, und animierten bunten Schnickschnack und Web-Gefummel nervt mich eher. Man könnte die Ergebnisse auch anders zusammen fassen. Vielleicht könnten wir das auch zusammen machen? (…und uns gegenseitig motivieren, das auch durch zu ziehen…)

    @DFranzenburg: guter Tipp mit mediathekview im Web. Das Programm selbst hatte ich vor einigen Jahren mal ausprobiert und als Schrott angesehen, und dann wieder deinstalliert. Vielleicht ist es ja besser geworden. Ob das für eine richtige Analyse des TV-Proramms etwas taugt? Weiss nicht, habe so meine Zweifel daran.
    Das Webangebot ist aber schön gemacht und gut, wenn man mal von Hand nach einer Sendung sucht.

  4. Ausgehend von diesem Artikel, wurde eine quelloffene Implementierung angefertigt, die die öffentlich-rechtlichen Programminformationen zusammensucht und einheitlich in einer Datenbank abspeichern kann. Sobald die SRF-Senderfamilie drin ist, wird die Software auch in Version 1.0 erscheinen: https://github.com/emschu/oer-collector

    Der Kern des Projektes ist die eigentliche Collector-Komponente sowie ein separater Webserver, der die gesammelten Informationen per JSON für andere (Programme) bereitstellen kann.
    Ein exemplarisches Demo-Frontend ist ebenfalls enthalten, kompletter Docker Support und eine simple Apache Solr Konfiguration.
    Neue Ideen, Verbesserungen, Features und Integrationen sind sehr gerne gesehen!

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert