GeoExplorer
Rund 80 % aller Daten haben einen räumlichen Bezug und lassen sich auf bestimmte Bereiche der Stadt verorten. Diese Geodaten können Verwaltung, Forschung, Wirtschaft und Bürger:innen neue Einblicke und Erkenntnisse liefern. Eine Umweltschützerin kann beispielsweise herausfinden, wo in Berlin welche Umweltbelastungen auftreten. Ein Stadtplaner benötigt für ein Projekt Daten über die Zusammensetzung der Bevölkerung in den Kiezen.
Kann Künstliche Intelligenz (KI) dabei helfen, Daten schneller zu finden, zu verstehen, ihre Relevanz für ein Vorhaben zu bewerten und vielleicht sogar neue Ideen für deren Nutzungsmöglichkeiten zu entwickeln? Aus dieser Fragestellung heraus wurde der GeoExplorer entwickelt, ein Teil einer Machbarkeitsanalyse rund um Open Data und KI.
Was ist der GeoExplorer?
Der GeoExplorer wurde von der Open Data Informationsstelle (ODIS) entwickelt und ist ein prototypisches Tool, mit dem Geodaten des Landes Berlin durchsucht und analysiert werden können. Der GeoExplorer richtet sich insbesondere an Personen, die wenig Erfahrung mit Geodaten haben, und bietet eine einfache Möglichkeit, diese Daten zu erkunden.
Wie funktioniert der GeoExplorer?
Der GeoExplorer nutzt KI, genauer gesagt ein Large Language Model (LLM), um Geodaten besser zu finden und zugänglich zu machen. Dabei werden Metadaten der Datensätze zunächst automatisch aus dem Berliner Open Data Portal und dem Geodatenportal Berlins gesammelt und für jeden einzelnen Metadatensatz ein sogenanntes Embedding erstellt und in eine Datenbank geschrieben. Jedes Embedding enthält einen speziellen Vektor, der auf dem Inhalt der Metadaten basiert. Dieser Vektor ist wie eine Art multidimensionale Koordinate, die den Inhalt der Metadaten in der Logik der KI verortet. Bei einer Suchanfrage wird darauf ein Vektor erstellt und mit den vorhandenen Vektoren in der Datenbank verglichen. Falls die Vektoren eine gewisse Nähe zueinander aufweisen, werden die jeweiligen Embeddings im Suchergebnis angezeigt.
Ergänzend zur Suche erlangt die Nutzer:in dank der KI ein besseres Verständnis der Informationen. So entschlüsselt der GeoExplorer die Datenattribute oder erklärt die Relevanz des ausgewählten Datensatzes in Bezug auf die Suchanfrage, wovon besonders Fachfremde profitieren können. Die Funktionen des GeoExplorer im Überblick:
Suchanfragen: Man kann frei nach Stichwörtern suchen, ganze Sätze eingeben oder vordefinierte Suchvorschläge verwenden.
Ergebnisliste: Der GeoExplorer liefert eine nach Relevanz sortierte Liste von Datensätzen, die der Suchanfrage entsprechen. Diese Liste wird durch ein KI-Sprachmodell erstellt, das die Relevanz der Datensätze bewertet und entsprechend sortiert. Nutzer:innen können somit schnell und effizient die wichtigsten Informationen finden.
Details: Jede Ergebnisliste enthält weiterführende Links, Downloadmöglichkeiten in gängigen Dateiformaten und eine visuelle Vorschau der Daten, die eine ersten Eindruck von der räumlichen Verteilung der Informationen vermittelt.
KI-gestützte Beschreibung: Die KI liefert detaillierte Beschreibungen der Datensätze, einschließlich der Attribute und der Relevanz für die Suchanfrage. Dies hilft den Nutzern, die Daten besser zu verstehen und zu nutzen.
Wie geht es weiter mit dem GeoExplorer?
Der GeoExplorer wurde entwickelt, um am Beispiel von Geodaten der Frage nachzugehen, wie KI dabei helfen kann, Daten besser zu finden, zu verstehen, ihre Relevanz für ein Vorhaben zu bewerten oder vielleicht sogar ganz neue Ideen zu generieren. Dabei ist er als ein „Proof of Concept“ zu verstehen. Der Geoexplorer stellt keine Alternative zur Geodatensuche der Senatsverwaltung für Stadtentwicklung, Bauen und Wohnen (SBW) oder zum Berliner Open Data Portal dar, sondern soll Anwender:innen, die sich bisher wenig mit Geodaten aus der Berliner Verwaltung auskennen, eine neue Möglichkeit zur Exploration bieten.. Mit den gewonnenen Erfahrungen und dem gesammelten Wissen zur Arbeitsweise von Large Language Models wollen wir Impulse und Ideen einbringen, wie perspektivisch in einem größeren Kontext KI eingesetzt werden könnte etwa als unterstützende Suche im Open Data Portal.
Durchgeführt von:
Gefördert von: