Adrian Pohl: Offene Bibliotheksdaten

Adrian Pohl arbeitet seit 2008 im Hochschulbibliothekszentrum des Landes Nordrhein-Westfalen (hbz). Seit Juni 2010 ist er Koordinator der Arbeitsgruppe der Open Knowledge Foundation zu Open Bibliographic Data. Im Interview berichtet Pohl über die Zusammenarbeit mit anderen Aktiven aus Wissenschaft und Bibliothekswelt. Ihr Ziel: der Aufbau einer Infrastruktur für offene bibliographische Daten.

Herr Pohl, worum geht es bei Open Bibliographic Data (OBD)?

Adrian Pohl: Wir orientieren uns an der Open-Access-Bewegung. Deren Idee wird bereits weitgehend in der Bibliothekswelt unterstützt: Ergebnisse öffentlich finanzierter Wissenschaft sollen auch jedem öffentlich zugänglich sein. Bibliotheken sind ebenfalls meist aus öffentlichen Geldern finanziert. Deshalb sollten die von ihnen produzierten Daten auch offen zugänglich und wiederverwendbar sein. Mit den „Prinzipen zu offenen bibliographischen Daten“ haben wir in der Open Knowledge Foundation klare Anforderungen für die Freigabe solcher Daten formuliert, insbesondere im Hinblick auf die Wahl der Lizenz. Bibliotheksdaten können vielen von Nutzen sein.

Wofür zum Beispiel?

Pohl: Sammlungen bibliographischer Daten können als eine Landkarte verstanden werden, die uns Orientierung gibt in der Landschaft unserer literarischen, wissenschaftlichen oder künstlerischen Erzeugnisse.

So können die Daten etwa in der Forschung genutzt werden. Für Historiker beispielsweise könnte die Frage interessant sein, in welchem Jahrhundert zu bestimmten Zeiten wo wichtige Publikationsorte waren. Mit automatisierten Abfragen offener Daten aus Bibliothekskatalogen ließe sich zügig eine Übersicht über die meistgenutzten Publikationsstandorte erstellen. Das ginge weit über das hinaus, was mit normalen Rechercheoptionen möglich ist.

Ein anderes Beispiel: Bibliotheksdaten werden bereits für Anwendungen genutzt, die den urheberrechtlichen Status eines Werkes berechnen, ob es geschützt oder gemeinfrei ist. Mehr freie Daten könnten diese Dienste enorm verbessern. Es lassen sich unzählige weitere Anwendungen denken.

Wer arbeitet in ihrer Arbeitsgruppe mit?

Pohl: Einerseits Bibliothekare mit ihren Daten, die überwiegend Bücher beschreiben. Andererseits Naturwissenschaftler, die vor allem Zeitschriftenartikel publizieren. Die sind oft in Bibliothekskatalogen gar nicht verzeichnet. In der Arbeitsgruppe kommen Vertreter dieser beiden Gruppen aus verschiedenen Ländern zusammen, um Open Bibliographic Data zu fördern.

Es geht dabei um die Frage, wie die webbasierte wissenschaftliche Publikationsinfrastruktur künftig aussehen wird. Open-Access-Publikationen erscheinen in der Regel im PDF-Format. Das eignet sich gut zum Ausdrucken, aber schlecht für die maschinelle Verarbeitung. Es gibt verschiedene Ansätze, wissenschaftliche Publikationen mit eigenen Identifikatoren (URIs) zu versehen, damit man auf sie verlinken und sie mit semantisch markierten Metadaten verknüpfen kann – sie also um Informationen über den Autor, das Erscheinungsjahr oder den Erscheinungsort zu ergänzen.

Wie würden Sie die OpenBib-Szene in Deutschland beschreiben?

Pohl: Derzeit beschränken sich ihre Aktivitäten in Deutschland auf den Bibliotheksbereich. Mir sind nur wenige Projekte in den Wissenschaften bekannt. Das Hochschulbibliothekszentrum des Landes Nordrhein-Westfalen (hbz) arbeitet seit dem Frühjahr 2010 mit Einrichtungen in Nordrhein-Westfalen und Rheinland-Pfalz daran, Bibliotheksdaten freizugeben. Noch konnten allerdings nicht alle Bibliotheken von einer Freigabe überzeugt werden. Dann gibt es noch Bibliotheken in Baden-Württemberg, die an OBD arbeiten.

Insgesamt ist die Szene noch eher klein, dafür aber stetig wachsend. Das Thema wird von vielen interessiert beobachtet. Vor Kurzem wurden etwa die „Empfehlungen zur Öffnung bibliothekarischer Daten“ einer deutschlandweiten Forschungsgruppe veröffentlicht. Auch die Herausgabe eines Leitfadens durch das hbz soll Open Data in der Bibliothekswelt voranbringen. Der Leitfaden wurde von dem Juristen Till Kreutzer verfasst und enthält Informationen zu rechtlichen Hintergründen von Open Data in der Bibliothekswelt.

Welche Vorbehalte haben Bibliotheken, die ihre Daten nicht freigeben?

Pohl: Die Bibliotheken sind der Meinung, dass sie sehr viel in ihre Kataloge investiert haben. Viele Menschen haben daran gearbeitet und einen Wert geschaffen, der nicht leichtfertig verschenkt werden dürfe. Allerdings erweckt der Ausdruck „verschenken“ einen falschen Eindruck: Man gibt die Daten ja nicht weg, man hat sie ja weiterhin.

Auch werden mögliche Einnahmequellen, die aus den Daten erschlossen werden könnten, als Argument genannt. Diese sind aber meist theoretischer Natur.

Eine weitere Sorge ist, sich selber überflüssig zu machen. Diese Angst erscheint mir aber unbegründet. Immerhin hat der, der die Daten liefert, die größte Glaubwürdigkeit, geht es um ihre Integrität. Der Lieferant bleibt also immer wichtig. Zudem werden ja auch neue Daten benötigt.

Ein vierter Punkt ist, dass das Potential von OBD meiner Meinung nach nicht erkannt wird.

Welche Chance entgeht diesen Bibliotheken?

Pohl: ODB bietet grundsätzlich die Möglichkeit, Kooperation zu fördern, sich auch international auszutauschen. Und eben mit anderen Akteuren zusammenzuwachsen, etwa mit der wissenschaftlichen Gemeinschaft oder der Wikipedia. Gerade bei dieser ist das Interesse an bibliographischen Daten groß. Es gibt ja in sehr vielen Artikeln bibliographische Verweise. Für die Wikipedia wäre es auch interessant, diese Daten mit Bibliothekaren gemeinsam pflegen zu können. Das Wissen aus der Wikipedia kann wiederum in Bibliothekskataloge zurückfließen. Es gibt ja auch dort Einträge zu Personen und Schlagwörtern.

Es könnte eine gegenseitige Verbesserung der Wissensbestände stattfinden. Solche Chancen verbaut man sich, wenn man seine Daten umarmt und nicht herausgeben will.

Gibt es international Vorreiter in diesem Bereich?

Pohl: In Deutschland passiert schon recht viel auf diesem Gebiet. Doch setzt Großbritannien gerade zum Überholen an. Die haben mit dem JISC, dem Joint Information Systems Committee, eine Einrichtung, die die wissenschaftlich-technische Informationsinfrastruktur im gesamten Vereinigten Königreich fördert. Das JISC unterstützt seit einiger Zeit stark Open Data in Bibliotheken, Archiven und Museen. Davon können wir in Deutschland sicherlich lernen, weil der Prozess dort sehr offen und transparent ist.

Wichtig sind auch die Entwicklungen bei der europäischen digitalen Bibliothek Europeana. Dort wurde im September eine neue Metadatenvereinbarung veröffentlicht. Mit dieser werden alle an die Europana gelieferten Metadaten gemeinfrei. Daraufhin haben sich die europäischen Nationalbibliotheken für die offene Lizenzierung ihrer Daten ausgesprochen.

Welche Wünsche haben Sie hinsichtlich Open Bibliographic Data?

Pohl: Ich würde mir wünschen, dass die deutsche Wissenschaftspolitik Open Data entdeckt und das Thema auf die politische Agenda kommt. Im vergangenen halben Jahr sind diverse Empfehlungen zur wissenschaftlichen Informationsinfrastruktur in Deutschland herausgekommen: Von der Deutschen Forschungsgemeinschaft (DFG), dem Wissenschaftsrat und der Leibnizgesellschaft. In keiner dieser Empfehlungen spielen Open Data eine nennenswerte Rolle. Dabei sollte das Thema bei der Planung einer Informationsinfrastruktur einen wesentlichen Platz einnehmen. Open Data sind eine optimale Basis, um die wissenschaftliche Informationsinfrastruktur weiter zu entwickeln.

Blog von Adrian Pohl

Bildnachweis: OFKN Blog

Der Interviewtext steht unter einer Creative Commons Lizenz: CC-by

Erschienen am 8.11.2011 im Open Data Blog auf zeit.de – Link

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.