Warum Linked Open Data für bessere KI sorgen kann – 3 Learnings
Was haben der Berliner Bürgermeister und ein Chatbot namens Bobbi mit Linked Open Data zu tun? Eine ganze Menge. Wie eine vernetzte, solide Datenbasis die Antworten von Chatbots und generativer KI nachhaltig verbessern kann – das illustriert die Fallstudie unserer Open Data Informationsstelle (ODIS), die wir hier im Kurzüberblick vorstellen.
Wir reden viel über den Einsatz generativer KI im öffentlichen Sektor – und weniger über die Qualität der Daten, die den KI-generierten Antworten zugrunde liegt. Dabei sind zugängliche, aktuelle Daten oft eine Herausforderung, wenn es um die Entwicklung von öffentlichen, digitalen Angeboten geht.
Unsere Open Data Informationsstelle (ODIS) beschreibt einen möglichen Lösungsansatz in drei Worten: Linked Open Data. Das heißt: Informationen eines Datensatzes werden einheitlich klassifiziert und maschinenlesbar veröffentlicht – und können miteinander vernetzt werden. Wie das gehen kann, demonstriert ODIS am Beispiel von Chatbot Bobbi und Kai Wegener.
Die ausführliche ODIS-Fallstudie zu Linked Open Data am Beispiel von Berliner Organigrammen findet sich direkt bei unseren Kolleg:innen, die drei wichtigsten Learnings haben wir hier versammelt.
1. Die Aussagen generativer KI sind nur so gut wie ihr Input.
Wer kennt es nicht: Man stellt eine scheinbar simple Frage und bekommt von der KI zum Teil keine oder nicht die richtige Antwort. So geschehen beim Berliner Chatbot Bobbi, als medienwirksam der als Bär personalisierte Chatbot auf die Frage „Wer ist Bürgermeister von Berlin?“ nicht die Antwort „Kai Wegner“ geben konnte. Woran das liegt? Die Antworten einer KI sind nur so gut wie die Daten, die zur Verfügung stehen – und die waren im Fall von Bobbi nicht aktuell.
2. Um die Aussagen generativer KI nachhaltig zu verbessern, kann eine verlinkte Datenbasis eine wichtige Komponente sein
Im Fall von Bobbi war die fehlende Antwort zum Regierenden Bürgermeister schnell gefunden, sodass Chatbot Bobbi um dieses Wissen schnell bereichert werden konnte. Aber wie sieht es allgemein mit der Aktualisierung von Daten aus? Franziska Giffey, die zwischenzeitlich Regierende Bürgermeisterin von Berlin war, hat nun die stellvertretende Rolle inne und ist zudem Senatorin für Energie, Wirtschaft und Betriebe. Sobald sich das ändert, ist auch die Datenbasis veraltet. Wenn Informationen als vernetzte, solide Datenbasis vorliegen, können sie jederzeit aktuell abgefragt werden und eine generative KI wie Bobbi nachhaltig verbessern.
3. Informationen, die in der Verwaltung erhoben, gesammelt und verarbeitet werden, sind aktuell für Menschen lesbar, selten aber für Maschinen.
Das Beispiel der Berliner Verwaltungs-Organigramme und Chatbot Bobbi zeigt: Die Informationen, die eine generative KI für die richtigen Antworten braucht, sind zwar vorhanden, liegen aber noch nicht in der richtigen Form – beispielsweise als nicht automatisiert lesbares PDF – vor. Gerade komplexe Organigramme wie die der Berliner Verwaltung, die regelmäßig aktualisiert werden müssen, sind ein Beispiel dafür, dass die Maschinenlesbarkeit von Informationen noch viel Potenzial hat. Auf dem Weg von Datensilos hin zu einem Wissensnetzwerk kann Linked Open Data Teil der Lösung sein.
Mehr Informationen über die Potenziale von vernetzten Daten im öffentlichen Sektor am Fall von Organigrammen der Berliner Verwaltungen gibt es bei der Fallstudie unserer Open Data Informationsstelle Berlin (ODIS).
ODIS
Die Open Data Informationsstelle Berlin (ODIS) begleitet die Stadt auf dem Weg zu einer partizipativen, nachhaltigen und datengetriebenen Gesellschaft mit dem Schwerpunkt auf die Bereitstellung und Nutzung offener Daten.