Nationaler Pandemie Kohorten Datensatz
Kontakt: napcode@idcohorts.net
Willkommen auf der NAPCODE Webseite!
Was ist NAPCODE?
NAPCODE ist ein vom BMFTR gefördertes Forschungsprojekt, das darauf abzielt, die bestehende Datenbasis aus der COVID-19-Forschung gezielt für die Erforschung des Post-COVID Zustands (PCC) nutzbar zu machen. Da die während der Pandemie erhobenen Datensätze oft sehr komplex sind und sich in ihrem Aufbau stark unterscheiden, schafft NAPCODE eine einheitliche und transparente Grundlage für die wissenschaftliche Arbeit
Projektziele
Das Hauptziel des Vorhabens ist es, die Post-COVID-Forschung zu vereinfachen und zu beschleunigen. Dies geschieht durch:
- Die Identifizierung relevanter Variablen für eine umfassende Post-COVID-Forschung in Zusammenarbeit mit Experten und Betroffenen und die Zusammenführung bisheriger Informationen in einem umfangreichen Variablensatz
- Die Erstellung dreier Datensätze für die Fachwelt.
- Pseudonymisierter Datensatz: Ein detaillierter Datensatz für Forscher:innen, der über ein spezielles Antragsverfahren (NAPKON UAC-Prozess) zugänglich ist.
- Anonymisierter Datensatz (Public Use File): Eine verallgemeinerte Version, die der Öffentlichkeit für einen schnellen Überblick frei zur Verfügung steht.
- Synthetischer Datensatz: Ein künstlich erzeugter Datensatz, der die Struktur der echten Daten beibehält und für erste Analysen genutzt werden kann, ohne Rückschlüsse auf Einzelpersonen zuzulassen.
- Die Verbesserung der Patientenversorgung durch ein tieferes Verständnis der Langzeitfolgen.
Für wen ist das NAPCODE Projekt besonders interessant?
Das Projekt richtet sich an verschiedene Zielgruppen, um den Austausch zwischen Wissenschaft und Gesellschaft zu fördern:
Wissenschaftler:innen: Sie erhalten schnellen und strukturierten Zugang zu qualitätsgesicherten Daten für ihre Forschungsfragen.
KI-Entwickler:innen: Die Datensätze können zur Optimierung von KI-Methoden und zur Erstellung von Trainingsdatensätzen genutzt werden.
Expert:innen & Betroffene: Durch die Einbeziehung ihrer Expertise wird sichergestellt, dass die Forschung nah an den realen Bedürfnissen der Patient:innen bleib
Der NAPCODE Variablensatz – Die Basis für gezielte Forschung
Damit Wissenschaftler den Post-COVID Zustand (PCC) effektiv untersuchen können, benötigen sie die „richtigen“ Daten. Der NAPCODE Variablensatz ist das Herzstück des Projekts und dient als standardisierter Werkzeugkasten für die Forschung.
Was ist das Besondere daran?
Anstatt wahllos alle verfügbaren Daten aus der Pandemiezeit zu nutzen, wurde ein spezifischer Satz an Merkmalen (Variablen) definiert, die für Post-COVID besonders aussagekräftig sind. Dies umfasst zum Beispiel:
Klinische Symptome und deren Verlauf.
Laborwerte und diagnostische Daten.
Informationen zur Lebensqualität der Betroffenen.
Wie wurde er erstellt?
Der Variablensatz ist nicht zufällig entstanden, sondern durch einen dreistufigen Prozess:
Literaturrecherche: Auswertung aktueller wissenschaftlicher Studien zu Post-COVID.
Expertise: Einbeziehung von Fachärzten und Wissenschaftlern.
Betroffenen-Perspektive: Einbindung von Patientengruppen, um sicherzustellen, dass die für Betroffene wichtigsten Aspekte (z. B. Fatigue oder Belastungsintoleranz) im Datensatz enthalten sind.
Warum ist das wichtig? Durch diesen einheitlichen Variablensatz wird die Forschung vergleichbar. Wenn verschiedene Forschergruppen mit demselben Satz an Variablen arbeiten, lassen sich Ergebnisse leichter kombinieren und validieren. Das spart Zeit und führt schneller zu neuen Erkenntnissen über Ursachen und Behandlungsmöglichkeiten von Post-COVID.
Der pseudonymisierte NAPCODE Datensatz
Der pseudonymisierte Datensatz des NAPCODE-Projekts stellt die detaillierteste und wissenschaftlich wertvollste Datenbasis dar. Er ist speziell darauf ausgelegt, Forscher:innen alle notwendigen Informationen für komplexe Analysen zum Post-COVID-Zustand (PCC) zur Verfügung zu stellen.
Hier sind die Details zum pseudonymisierten Datensatz:
Der Datensatz basiert auf den umfangreichen Daten des Nationalen Pandemie-Kohorten-Netzes (NAPKON). Er führt Informationen aus allen drei NAPKON-Kohorten (sektorübergreifend, hochauflösend und bevölkerungsbasiert) zusammen und rationalisiert diese auf die für die Post-COVID-Forschung wesentlichen Variablen.
- Er umfasst spezifische Variablen zu Aspekten wie Diagnosestellung, Risikofaktoren und medizinischen Interventionen. Diese Variablen wurden vorab durch Literaturrecherchen sowie Befragungen von Expert:innen und Betroffenen als besonders relevant identifiziert.
Die Daten wurden prospektiv über einen Zeitraum von der akuten Infektion bis zu einer dreijährigen Nachbeobachtung erhoben. Der Datensatz wird bereinigt, kuratiert und so weit wie möglich vereinheitlicht, um eine optimale Grundlage für die Forschung zu bieten.
Da es sich um sensible Gesundheitsdaten handelt, die unter Pseudonym (verschlüsselte Identität) gespeichert sind, ist der Zugang streng reglementiert. Forscher:innen müssen weltweit einen formellen Antrag über das NAPKON Use-and-Access-Verfahren (UAC) stellen, der auch ein entsprechendes Ethikvotum beinhaltet.
Um die Arbeit mit dem komplexen Datensatz zu erleichtern, stellt das Projektteam frei zugängliche R-Skripte, Tutorials und Leitlinien bereit. Diese helfen bei der Datenverarbeitung und der Vorbereitung wissenschaftlicher Analysen.
Dieser Datensatz dient zudem als Ausgangspunkt für die Erstellung der anonymisierten und synthetischen Varianten, die für einen breiteren Zugang ohne Antragsverfahren vorgesehen sind.
