Neujahrsinterview mit Nicolas Zimmer: Von Open Data über Open Source zu Open Infrastructure
2024 hat gezeigt: Daten bleiben Treiber für den technologischen Fortschritt – Künstliche Intelligenz etwa ist nur so gut wie die ihr zugrundeliegenden Daten.
Welche Entwicklungen und Potenziale zeigen sich aktuell für Open Data?
Für die große Mehrheit der Berlinerinnen und Berliner sind offene Datensätze zunächst ohne Wert. Erst durch die Anwendbarkeit entsteht der Nutzen – und sei es nur durch eine Erschließung der Daten für Recherchezwecke. Wie sich bei unserem Projekt Parla gezeigt hat, können Large Language Models (LLM), wie die von ChatGPT, offene Daten nutzen, um konkrete Fragen schnell zu beantworten.
Das Stichwort lautet hier Retrival Augmented Generation: Ich glaube, mit einer solchen Architektur – die Daten aufbereitet, ein LLM zur Generierung nutzt und einer guten, leicht verständlichen Nutzeroberfläche – lassen sich über Open Data hinaus bis zu 80% aller aktuellen Anwendungsfälle für KI in der Verwaltung gut abbilden. Dafür müssen keine Millionen investiert werden.
Sind denn die Daten der Berliner Verwaltung für solche KI-Anwendungen gut nutzbar? Man hört immer wieder von sogenannten Datensilos und geschlossenen Systemen.
Schon lange ist klar, dass wir die Daten innerhalb der Berliner Verwaltung so bereitstellen müssen, dass sie auch zugänglich sind. Damit meine ich nicht unbedingt öffentlich, sondern zwischen den Behörden teilbar – natürlich im Rahmen des Datenschutzes. Denn nach wie vor sind viele relevante Informationen in Dokumenten auf der Festplatte von Verwaltungsmitarbeitenden oder in Fachverfahren eingeschlossen.
Der Datahub für Berlin, also genau eine solche Datenplattform, wird dieses Jahr kommen und in weiten Teilen Open Source nutzen. Ein großer Schritt zu mehr digitaler Souveränität in Berlin.
Damit das alles Wirklichkeit wird, braucht es doch vermutlich auch andere Prozesse in der Verwaltung?
Berlin ist weiter auf dem Weg, digitaler Vorreiter zu sein. Wir sind nämlich deutlich besser, als gemeinhin vermutet wird: Der Senat hat im November beschlossen, dass zukünftig bevor ein Gesetzentwurf geschrieben wird, der notwendige digitale Prozess definiert wird. Mit diesem Digitalcheck wird der Prozess vom Kopf auf die Füße gestellt und für alle Beteiligten später das Leben leichter, mit guten Anwendungen für die Berlinerinnen und Berliner, Wirtschaft und Verwaltung. Wenn dies mit einer offenen digitalen Infrastruktur kombiniert wird, auf der diese Verfahren sicher und verlässlich entwickelt werden können, werden wir im Jahr 2025 große Fortschritte erleben. Dabei kann die Technologiestiftung das Land tatkräftig unterstützen.