„Kerndatensätze zeigen, wie wichtig Daten für ein transparentes und smartes Berlin sind“
ODIS, die Open Data Informationsstelle für die Berliner Verwaltung, die wir im Auftrag der Senatsverwaltung für Wirtschaft, Energie und Betriebe betreuen, hat gerade eine Liste der 100 Kerndatensätze von Berlin veröffentlicht. Lisa Stubert aus dem ODIS-Team erläutert im Gespräch, was für sie ein Kerndatensatz ist und wie sich das Thema Open Data in Berlin entwickelt.
ODIS, die Open Data Informationsstelle für die Berliner Verwaltung, für die Du arbeitest, hat gerade eine Übersicht über Berlins Kerndatensätze herausgegeben. Was versteht ihr unter Kerndatensätzen?
Lisa Stubert: Kerndatensätze sind Datensätze, deren offene Bereitstellung ein großes Weiterverwendungspotential birgt, da sie für die Stadtgesellschaft Berlins besonders interessant sind. Eine strenge Definition des Begriffs gibt es zwar nicht, aber klare Kriterien, nach denen wir eine Vorauswahl von Datensätzen bewertet haben.
Dazu zählt zum einen das Transparenzpotential. Der Gesetzgeber schreibt mittlerweile in einigen Fällen vor, dass Daten offengelegt werden müssen. Bestimmte Themenbereiche sind in der Open Data-Rechtsverordnung aufgelistet, die im letzten Jahr als Ergänzung des Berliner E-Government-Gesetzes in Kraft getreten ist. Dann gibt es noch klassische Verwaltungsdaten, die von allgemeinem Interesse sind und jederzeit abrufbar und auch weiterverwertbar sein sollten. Ich denke da beispielsweise an Wahlergebnisse. Andere Daten sind dagegen für bestimmte Zielgruppen wie die Wissenschaft besonders wertvoll, zum Beispiel aus dem Bereich Umwelt.
Unsere Auswahl der Kerndatensätze haben wir mit Expert:innen aus Verwaltung, Community und Wirtschaft abgestimmt. Letztlich sind es übrigens nicht 100, sondern 103 Datensätze geworden. -Wir haben kurzerhand noch drei Corona-Datensätze aufgenommen. Diese Erweiterung finde ich sehr gut, weil sie zeigt, dass Bedarfe sich im Laufe der Zeit auch ändern können. Daten, die vorher niemand auf dem Schirm hatte, wie die Auslastung von Intensivbetten, werden plötzlich zu Kerndatensätzen und verlieren – im Falle von Corona hoffe ich das zumindest – nach einer gewissen Zeit wieder an Relevanz.
Hast du selbst eigentlich Lieblingsdatensätze?
Lisa Stubert: Als Geoinformatikerin habe ich natürlich eine kleine Schwäche für alle räumlichen Daten: was sie über die Stadt erzählen, welche Zusammenhänge durch Kombination und Weiterverarbeitung sichtbar werden. Das finde ich schon spannend. Übrigens haben mehr Daten als man vielleicht denkt einen Raumbezug. Das betrifft auch die deutliche Mehrheit unserer Kerndatensätze.
Wir arbeiten im Rahmen eines Projektes für die Senatsverwaltung für Stadtentwicklung, Bauen und Wohnen daran, Geodaten, die häufig von den Bezirken erfasst werden, koordiniert zu veröffentlichen. Es kann gut sein, dass die Bezirksämter beispielsweise ein Thema wie die Standorte von Behindertenparkplätzen ganz unterschiedlich aufbereiten, so dass die Daten keinem Standard folgen. Gemeinsam mit der Senatsverwaltung und den Bezirken haben wir einen Prozess erprobt, der in Zukunft gewährleisten soll, dass die Geodaten vereinheitlicht und berlinweit zusammengeführt werden können.
Es gehört zu Euren Aufgaben bei ODIS, die Veröffentlichung von Open Data zu unterstützen. Aber ihr macht noch viel mehr, oder?
Lisa Stubert: Das Unterstützungsangebot ist schon ein sehr wichtiger Aspekt unserer Arbeit, aber auch die Vermittlung von Datenkompetenzen. Zum Thema offene Geodaten bieten wir zum Beispiel QGIS-Schulungen an und wir veröffentlichen Leitfäden, Tutorials und Tipps rund um Metadaten, Datenvisualisierung und viele weitere Themen.
Ein anderes Anliegen ist für uns die Erhöhung der Datenqualität und die Nutzung der richtigen Formate und Technologien. Viele Datensätze sollten idealerweise über Schnittstellen zur Verfügung gestellt werden, so dass Interessierte unkompliziert auf stets aktuelle Informationen zugreifen können. In der Berliner Verwaltung ist das noch eher selten der Fall. Da wird noch viel mit Dateien gearbeitet, personenbezogene Informationen werden händisch anonymisiert und dann beispielsweise als PDF-Bericht oder als Excel-Tabelle mit Fokus auf Menschenlesbarkeit zur Verfügung gestellt. Wir erklären dann, was zu beachten ist, um Maschinenlesbarkeit sicherzustellen, was ja eines der Hauptkriterien für Open Data ist. Manchmal ganz konkret, indem wir einen Datensatz selbst überarbeiten.
Am Anfang mussten wir noch sehr für das Thema und unser ODIS-Angebot werben, mittlerweile kommen die Leute meistens direkt auf uns zu. Das freut uns und macht natürlich viel mehr Spaß. Wir organisieren auch regelmäßig Veranstaltungen, um über Neuigkeiten zu informieren und den Austausch zu fördern.
Und dann gibt es noch den ganz praktischen Bereich: Wir entwickeln nämlich auch selbst Anwendungen und Prototypen, die zeigen welches Potential in offenen Daten steckt oder der Verwaltung die Arbeit erleichtern können. Der Wahlbezirkseditor, den wir für das Bezirksamt Tempelhof-Schöneberg entwickelt haben, wurde im letzten Oktober sogar mit dem Berliner Verwaltungspreis ausgezeichnet.
Zur Veröffentlichung der Kerndatensätze gehört übrigens auch eine Tabelle der Datensätze auf unserer Website. Sie enthält, falls vorhanden, Verlinkungen zu den jeweiligen Datenquellen der schon offenen Kerndatensätze. Dort ist zu sehen, dass viele der Kerndatensätze bereits Open Data sind, aber halt bei weitem nicht alle. Aber genau dafür ist diese Liste da, um eine Diskussion anzuregen und zu zeigen, wo als nächstes angepackt werden sollte.
Was mir noch wichtig ist: Der Erfolg von ODIS ist ganz wesentlich auch meiner Kollegin Victoria Boeck zu verdanken, die seit Beginn des Projektes für ODIS arbeitet und die Kerndatensätze ins Leben gerufen hat. Sie ist zurzeit in Elternzeit und wir freuen uns, wenn sie hoffentlich im Herbst wieder einsteigt.
ODIS
Die Open Data Informationsstelle Berlin (ODIS) begleitet die Stadt auf dem Weg zu einer partizipativen, nachhaltigen und datengetriebenen Gesellschaft mit dem Schwerpunkt auf die Bereitstellung und Nutzung offener Daten.