Rückblick: Symposium „Demokratische KI – Berliner Wege zu Verantwortung, Steuerung und Souveränität“
Wer entscheidet, unter welchen Bedingungen KI eingesetzt wird? Beim Symposium „Demokratische KI. Berliner Wege zu Verantwortung, Steuerung und Souveränität“ wurde diese Frage auf den öffentlichen Sektor bezogen. Im Publix Berlin diskutierten wir am 12. Mai 2026 mit Fachleuten und Gäst:innen aus der Stadtgesellschaft darüber, nach welchen Kriterien der Einsatz von KI als gemeinwohlorientiert gelten kann und welche politische Verantwortung daraus für Berlin folgt.
Warum beginnt demokratische KI beim Gemeinwohl?
Der Nachmittag im Publix begann mit einer begrifflichen Klärung. Dr. Theresa Züger vom Alexander von Humboldt Institut für Internet und Gesellschaft (HIIG) sprach in ihrer Keynote über Gemeinwohl als Orientierung für KI-Systeme. Gemeinwohl, so wurde in ihrem Vortrag deutlich, ist kein feststehender Zustand. Es entsteht in Aushandlungsprozessen und muss sich später daran messen lassen, ob eine Anwendung im Alltag den erwarteten Nutzen bringt.
Wenn Menschen nicht verstehen, nicht sehen oder nicht wissen können, dass KI eingesetzt wird, können sie auch nicht mitreden.
Für den Einsatz von KI im öffentlichen Sektor ist dieser Gedanke entscheidend. Eine Anwendung kann technisch funktionieren und trotzdem Fragen offenlassen: Welches Problem soll sie bearbeiten? Wer war an der Entwicklung beteiligt? Welche Daten wurden genutzt? Wer prüft später, ob die Anwendung Menschen entlastet oder neue Risiken schafft?
Theresa Züger plädierte für eine problemorientierte Perspektive. Am Anfang stehe die gesellschaftliche oder administrative Aufgabe. Erst danach lasse sich bewerten, ob KI ein geeignetes Mittel sei.
Der Einsatz von gemeinwohlorientierter KI braucht deswegen eine Begründung, die öffentlich nachvollziehbar bleibt.
Was zeigen Beispiele aus der Praxis?
Die Keynote führte durch verschiedene Anwendungen, die KI sehr unterschiedlich nutzen:
- Forensic Architecture setzt Computer Vision ein, um Tränengasmunition auf Bildmaterial zu erkennen.
- AmurAI aus Argentinien wertet öffentliche Gerichtsunterlagen aus, damit Gewalt gegen Frauen in Strafverfahren besser sichtbar wird.
- Full Fact AI unterstützt Faktenchecker:innen dabei, mögliche Desinformation aus großen Datenmengen herauszufiltern.
Diese Beispiele zeigen KI als begrenzte Funktion in einem größeren Arbeitsprozess. Ein System filtert Material. Ein anderes macht Muster sichtbar. Die Bewertung bleibt bei Menschen.
Wichtig war dabei die Frage nach der Wirkung. Theresa Züger beschrieb, wie schwer sich der Beitrag eines KI-Systems isolieren lässt. Beim Faktencheck entstehe Nutzen erst im Zusammenspiel mit redaktioneller Arbeit, fachlicher Prüfung und bestehenden Abläufen. Das System allein erzeuge noch keine demokratische Wirkung.
Ein KI-System kann Informationen vorsortieren. Die Verantwortung für Bewertung und Entscheidung bleibt bei Menschen.
Welche blinden Flecken gehören zur Debatte?
Die Keynote weitete den Blick über einzelne Anwendungen hinaus. Theresa Züger sprach über ökologische Kosten, Datenarbeit und globale Machtverhältnisse. Besonders deutlich wurde das beim Thema Datenarbeiter:innen. Viele Modelle beruhten auf Arbeit, die für Nutzende kaum sichtbar sei: Menschen annotierten Daten, bewerteten Inhalte oder sichteten belastendes Material. Oft geschehe das über externe Anbieter und unter schwierigen Arbeitsbedingungen.
Aus dem Publikum kam später der Hinweis, dass Menschenrechte auch im direkten Umfeld betrachtet werden müssen. Diskriminierung durch KI-Systeme sei keine abstrakte Gefahr. Sie könne Menschen dort treffen, wo Verwaltung, Bildung oder soziale Sicherung Entscheidungen vorbereiten. Theresa Züger nahm diesen Punkt auf und verwies darauf, dass Bias und Diskriminierung auch in ihrem Assessment eine wichtige Rolle spielen würden.
Damit wurde eine Aufgabe sichtbar, die leicht aus dem Blick gerät. Demokratische KI muss die Entstehungsbedingungen von Systemen prüfen und ihre Folgen vor Ort ernst nehmen.
Ist KI ein neutrales Werkzeug?
Eine Publikumsfrage griff eine verbreitete Metapher auf. Wird KI zu oft als Werkzeug beschrieben? Theresa Züger bestätigte: Diese Metapher erfasse KI-Systeme nur begrenzt, weil sie Infrastrukturen und eingebettete Annahmen ausblende.
Eigentlich finde ich die Metapher des Werkzeugs in Bezug auf KI-Systeme nicht gut, weil sie oft die Komplexität der Infrastrukturen und die Nicht-Neutralität von Technologie verdeckt.
Für die weiteren Gespräche war dieser Punkt wichtig. Wer KI nur als Werkzeug betrachtet, schaue vor allem auf deren Bedienung. Für den öffentlichen Sektor reiche das nicht aus. Dort gehe es auch um Modellwahl, Betrieb, Updates und um die Frage, wer ein System prüfen oder verändern kann.
Verwaltung arbeitet mit rechtlich gebundenen Verfahren und sensiblen Informationen. Schon eine Zusammenfassung könne Gewicht verschieben, wenn Nuancen verloren gehen. Deshalb gehöre zur Verantwortung nicht nur der richtige Umgang mit einem System, sondern auch die Prüfung seiner Voraussetzungen.
Entscheidend ist, wie ein KI-System ausgewählt, betrieben und überprüft wird.
Wer kontrolliert KI im staatlichen Einsatz?
Im ersten Panel diskutierten Dr. Esther Görnemann vom Weizenbaum-Institut, Carolin Körner von der Bundesdruckerei und Nicolas Zimmer von der Technologiestiftung unter Moderatorin von Gesa Trojan. Im Mittelpunkt stand die Frage, wie öffentliche Stellen handlungsfähig bleiben, wenn sie KI-Systeme einsetzen.
Esther Görnemann beschrieb Abhängigkeiten über verschiedene technische Ebenen hinweg. Dazu gehören Rechenzentren, Cloud-Dienste, Software, Modelle und Anwendungen. Für die Verwaltung sei relevant, wer ein System betreibt, welchem Recht ein Anbieter unterliegt und wie austauschbar einzelne Komponenten sind.
Das Problem steht im Raum: Wir sind durch diese starke einseitige Abhängigkeit politisch erpressbar. Neben dem Datenabfluss ist das ein Kernproblem, auf das man in der Verwaltung gerade schaut.
Carolin Körner lenkte den Blick auf die KI-Modelle, die der Markt zurzeit anbietet. Verwaltung müsse selbst bewerten können, welches System für welche Aufgabe geeignet sei. Die Bundesdruckerei arbeite dafür an einem Benchmarking, das Sprachmodelle mit Blick auf verwaltungsspezifische Anforderungen untersucht.
Es reicht nicht, ein europäisches Sprachmodell zu haben, auch wenn das großartig wäre. Wir brauchen ein funktionierendes KI-Ökosystem.
Der KI-Assistent BärGPT wurde in diesem Panel als Berliner Erfahrungsfall erwähnt. Nicolas Zimmer beschrieb den verwaltungsinternen Chatbot als System, das auf einem europäischen Modell basiert und Berliner Verwaltungswissen einbindet. Die Diskussion zeigte, wie eng Nutzbarkeit, Datenschutz und Kontrolle miteinander verbunden sind.
Wir haben mit BärGPT für die Berliner Verwaltung den verwaltungsinternen Chatbot entwickelt. Im Kern ist das natürlich kein Frontier-Modell, sondern zunächst einmal die Möglichkeit, in einem rechtskonformen Raum KI in der Verwaltung zu nutzen.
Kontrolle entsteht dort, wo Betrieb, Modellwahl und Verantwortung nachvollziehbar bleiben.
Wie viel Leistung braucht vertrauenswürdige KI?
Eine Frage aus dem Publikum brachte eine wichtige Abwägung in die Diskussion. Müssen öffentliche Stellen gelegentlich geringere Modellleistung akzeptieren, wenn sie dadurch mehr Kontrolle behalten?
Die Antworten waren differenziert. Niemand warb für schwache Systeme. Zugleich wurde deutlich, dass nicht jede Verwaltungsaufgabe ein großes Allzweckmodell braucht. Viele Aufgaben verlangen Verlässlichkeit und klare Grenzen sowie eine saubere Einbettung in bestehende Verfahren.
Carolin Körner sprach von Vertrauen als Währung. Verwaltung könne schwer mit Systemen arbeiten, deren Fehler später nicht erklärbar seien. Dr. Esther Görnemann ergänzte die technische Perspektive. Sprachmodelle blieben mit Unschärfen verbunden. Fachliche Prüfung und klare Zuständigkeit würden dadurch nicht entbehrlich.
Für den öffentlichen Sektor zählt nicht allein, was ein System leisten kann. Entscheidend ist auch, ob Grenzen erkennbar bleiben.
Wie können Bürger:innen Kontrolle ausüben?
Eine weitere Publikumsfrage führte zur demokratischen Kontrolle durch Bürger:innen. Wie lässt sich nachvollziehen, welche ethischen Grundlagen gelten, wenn KI in staatlichen Verfahren eingesetzt wird? Was passiert bei sensiblen Anwendungen, etwa wenn Sozialleistungen oder Risikobewertungen betroffen sind?
In der Diskussion wurden bestehende Ansätze genannt, etwa Übersichten zu KI-Anwendungen auf Bundesebene und Benchmarking-Verfahren. Zugleich wurde deutlich, dass Transparenz verständlich sein muss. Eine Dokumentation hilft nur, wenn Menschen erkennen können, was geprüft wurde und welche Folgen sich daraus ergeben.
Auch unabhängige Kontrolle wurde angesprochen. Gerade bei Anwendungen mit möglichen Auswirkungen auf einzelne Personen reiche eine interne Prüfung nicht aus. Bürger:innen bräuchten nachvollziehbare Informationen und Wege, Entscheidungen hinterfragen zu können.
Transparenz muss für Betroffene verständlich und nutzbar sein.
Was macht die Umsetzung in Berlin anspruchsvoll?
Das zweite Panel führte stärker in die Berliner Praxis. Anja Lüttmann vom CityLAB Berlin sprach mit Dr. Benjamin Seibel, Yasemin Efiloğlu von PD und Dr. Matthieu Binder vom iRights.Lab über die Frage, ob der öffentliche Sektor auf gemeinwohlorientierte KI vorbereitet ist.
Yasemin Efiloğlu verwies auf bestehende Verfahren, an die KI-Anwendungen anknüpfen können. Projektmanagement, Datenschutz, Antidiskriminierung und Barrierefreiheit müssten so übersetzt werden, dass aus Anforderungen prüfbare Schritte würden. Öffentliche KI könne nur dann tragfähig eingeführt werden, wenn solche Fragen früh bearbeitet würden.
Im Endeffekt muss man sich gerade noch einmal überlegen, wer innerhalb Deutschlands die Aufsicht übernimmt.
Benjamin Seibel schilderte am Beispiel BärGPT, wie weit der Weg vom Prototyp zur Nutzung in der Verwaltung sein kann. Ein funktionierendes System reiche nicht aus. Für den Einsatz brauche es Abstimmungen mit verschiedenen Stellen, unter anderem zu Datenschutz, IT-Sicherheit, Barrierefreiheit und Mitbestimmung.
Die Einführung eines KI-Assistenten wurde oft wie ein Produktthema behandelt, obwohl es von Anfang an eigentlich ein Infrastrukturthema war.
Die Diskussion machte deutlich, dass solche Verfahren demokratische Technik absichern. Schwierig wird es dort, wo Zuständigkeiten unklar bleiben oder Umsetzung an zu wenigen Stellen hängt.
Es braucht immer Umsetzung. Das heißt, es gibt Verantwortung auch außerhalb des Parlaments.
Sorgfalt braucht klare Verantwortung, damit sie in der Praxis wirksam wird.
Welche KI braucht die Verwaltung?
Gegen Ende des zweiten Panels ging es um die Frage, welche Art von KI für die Verwaltung sinnvoll ist. Benjamin Seibel sprach über kleinere, offene und spezialisierte Modelle. Für viele Verwaltungsaufgaben müsste ein System kein umfassendes Weltwissen abbilden. Wichtiger seien Verfahren, Fristen, Zuständigkeiten und rechtliche Hierarchien.
Ein Beispiel zeigt diese Herausforderung: Ein Sprachmodell verarbeitet einen Gesetzestext zunächst als Text. Für die Verwaltung reiche das nicht. Sie muss wissen, welche Norm gilt, welche Fassung aktuell ist und wie sich verschiedene Ebenen des Rechts zueinander verhalten.
Damit verschob sich die Perspektive: Für die Verwaltung sei nicht die Größe eines Modells allein entscheidend. Entscheidend sei vielmehr, ob fachliche Strukturen verlässlich verarbeitet würden und ob die Grenzen des Systems sichtbar blieben.
Die Verwaltung braucht KI-Systeme, die fachliche Zusammenhänge zuverlässig abbilden.
Was bleibt von diesem Symposium?
Am Ende stand kein fertiger Fahrplan. Der Nachmittag zeigte vielmehr, wie voraussetzungsreich der Begriff demokratische KI ist. Gemeinwohl muss begründet werden. Kontrolle braucht technische und organisatorische Voraussetzungen. Beteiligung setzt Verständlichkeit voraus.
Für Berlin ergeben sich daraus mehrere Aufgaben:
- KI-Anwendungen im öffentlichen Sektor müssen prüfbar eingeführt werden.
- Bürger:innen brauchen nachvollziehbare Informationen über den Einsatz solcher Systeme.
- Die Verwaltung braucht Verfahren, die Schutzstandards ernst nehmen und muss zugleich handlungsfähig bleiben.
Ein Anwendungsszenario macht das greifbar: Wenn ein KI-System viele Rückmeldungen aus einem Beteiligungsverfahren bündelt, kann es die Auswertung erleichtern. Gleichzeitig muss klar sein, welche Daten eingeflossen sind, wie sortiert wurde und wer die Ergebnisse fachlich prüft. Nur dann bleibt nachvollziehbar, wie aus vielen Stimmen eine Übersicht entsteht.
Demokratie lässt sich nicht automatisieren. Demokratische KI zeigt sich im Verfahren und daran, ob ihr Einsatz begründet und überprüft werden kann.