© Unsplash/Clay Banks
  • Thema Reallabor

Post-COVID-Datenmodell für die Dateninstitut-Challenge

Durch die Digitalisierung aller Lebensbereiche gibt es immer mehr Daten, etwa zur Corona-Pandemie und Long Covid. Aber wie können diese Daten allen – von Gesellschaft über Verwaltung bis zur Forschung – zugutekommen? Am Beispiel von Gesundheitsdaten entwickeln wir ein Post-COVID-Datenmodell im Rahmen der Dateninstitut-Challenge vom Bundesministerium des Innern und für Heimat (BMI).


Zielgruppe
Zivilgesellschaft, Wissenschaft, Verwaltung
Thema
Reallabor
Laufzeit
ab Juni 2024

Worum geht es bei der Entwicklung eines Post-COVID-Datenmodells?  

Die medizinische Forschung hat bereits eine Vielzahl an Daten zu Post-COVID erhoben und trotzdem bleiben wichtige Fragen ungeklärt. Welche Auswirkungen hat etwa das Krankheitsbild Long Covid nicht nur für Einzelpersonen sondern auch gesamtgesellschaftlich? Was kann die die Verwaltung oder die Forschung tun, um den Alltag mit der Erkrankung zu erleichtern? Die Verknüpfung von Gesundheitsdaten mit allgemeinen Datensätzen – etwa zu Bildung oder Arbeitsmarkt – könnte einen Beitrag zur Beantwortung dieser Fragen leisten.  

Warum ein Post-COVID-Datenmodell? Die COVID-19-Pandemie ist ein Beispiel dafür, wie ein breiter Teil der Gesellschaft davon profitieren kann, wenn relevante Daten aufbereitet und verfügbar sind. COVID-Daten helfen uns bereits jetzt, die Krankheit, ihre Auswirkungen und Umstände besser zu verstehen. Aber welches Potenziale können diese Daten noch entfalten, wenn wir sie aus ihrem Erhebungszweck heraus mit weiteren Daten in Verbindung setzen? Das ist die zentrale Frage, die wir mit unserem Ansatz für ein Post-COVID-Datenmodell verfolgen.  

Miteinander verbundene Daten können eine Vielzahl von Fragen beantworten, zum Beispiel:  

  • Welche demografischen Gruppen sind besonders von Post-COVID betroffen? 

  • Gibt es räumliche Unterschiede, inwieweit Behandlungs- und Unterstützungsangebote zugänglich und effizient sind? 

  • Gibt es Zusammenhänge zwischen Armut und Post-COVID? 

  • Wie wirkt sich Post-COVID auf die Leistungen von Schüler:innen aus? 

Gemeinsam mit dem Berlin Institute of Health (BIH) der Charité Berlin entwickeln wir ein Konzept für ein nachhaltiges und offenes Datenmodell, das die Post-COVID-Forschung unterstützt. Dabei kombinieren wir die Daten- und Prototyping-Expertise unserer Kolleg:innen der Open Data Informationsstelle (ODIS) und des CityLAB. Das Projekt wird im Auftrag des Bundesministerium des Innern und für Heimat (BMI) durchgeführt. 

Wie gehen wir bei der Entwicklung eines Post-COVID- Datenmodells vor?  

Mit unserem Post-COVID-Datenmodell verfolgen wir einen transparenten und offenen Ansatz:  

  • Das Datenmodell soll einerseits den Zugang zu wichtigen medizinischen Forschungsdaten erleichtern und andererseits die Verknüpfung mit weiteren Daten aus vielseitigen Forschungsbereichen ermöglichen. 

  • Dabei muss das Datenmodell in der Lage sein, unterschiedliche Datensätze –einschließlich personenbezogener, anonymisierter, oder pseudonymisierter Daten - zu integrieren und im besten Fall über APIs regelmäßig und automatisiert zu aktualisieren. 

  • Ziel ist es, das Datenmodell der Öffentlichkeit – z.B. unter einer CC-BY 4.0 oder DLD-2.0-Lizenz – kostenfrei und offen zugänglich zu machen. Dafür entwickeln wir Prozesse, die die Interoperabilität und Qualität der Daten sowie des Datenmodells sicherstellen, unter Berücksichtigung bestehender Metadaten-Standards.  

Wie geht es weiter mit der Entwicklung eines Post-COVID-Datenmodells? 

In der ersten Projektphase haben wir ein Konzept für ein Post-COVID-Datenmodell entwickelt, also die notwendigen Prozesse und Anforderungen beschrieben, um in den nächsten Stufen eine initiale Software-Implementierung aufzubauen. Darüber hinaus haben wir Prozesse dokumentiert, wie Datenhaltende und -nutzende an das Modell angebunden werden können und wie die Forschungsgemeinschaft ihre Bedürfnisse einbringen kann. Unser Zielbild ist ein Datenmodell, dass auch für andere Domänen nachgenutzt und übertragen werden kann, über das Beispiel von Post-COVID-Daten hinaus.

Nachdem wir uns mit unserem Team für die zweite Projektphase qualifiziert hatten, fokussierten wir uns auf die technische Umsetzung der Werkzeuge zur Verschneidung von Daten, die Anlage eines Metadatenkatalogs, die weitere Einbindung von Stakeholdern und die Entwicklung von Frontend-Komponenten wie Wireframes, um die Interaktion mit dem Datenmodell zu ermöglichen.

In der dritten und letzten Stufe der Challenge arbeiten wir weiter mit voller Kraft an der Umsetzung unseres Prototypen. Das Interface wird programmiert und die Skripte zur Verschneidung finalisiert. Darüber hinaus entwerfen wir ein Konzept zum Betrieb des Datenmodells.

Im Auftrag von

In Zusammenarbeit mit