Skip to content

Fuenfgeld/DMA2024TeamB

Repository files navigation

DMA2024TeamB

PRECISE-BC

PRECISE-BC: Probing QALY Changes in Breast Cancer Patients with and without Comorbidities

Ein Data Management Projekt im Rahmen des Online-Masters "Biomedizinische Informatik und Data Science" an der Hochschule Mannheim.

Dieses GitHub-Repository enthält den Code und die Dokumentation für das Data Management Projekt "PRECISE-BC". Ziel des Projekts ist die Datenaufbereitung, -verarbeitung und Analyse von synthetischen Patientendaten, die mit Synthea TM generiert wurden. Das Hauptaugenmerk liegt auf der Auswirkung von Komorbiditäten auf die Lebensqualität von Brustkrebspatientinnen und -patienten.

Projektübersicht

Das Projekt simuliert und erarbeitet alle Prozesse eines Datenmanagement-Projekts: Forschungsdatenmanagement@2x

  1. Erstellen des Datenmanagementplan der Projektoutline und Studienziele sowie Datenschutzfolgeabschätzung
  2. Erstellung der Quelldatenbank mittels Rohdaten/ Quelldaten
  3. Überführen der Daten in ein Data Warehouse, (ETL-Prozess)
  4. Erarbeitung eines statistischen Analyse Plans sowie Analyse und Visualisierung der Daten gemäss der selbst gewählten Forschungsfrage

Forschungsfrage

Wie beeinflussen Komorbiditäten die Lebensqualität von Brustkrebspatientinnen und -patienten?

Projektdurchführung

  • Datenmanagement: Erstellung eines Datenmanagementplans, Durchführung einer Datenschutz-Folgenabschätzung.
  • Quelldatenbank: Quelldaten wurden mithilfe eines Google Colab Notebooks in die Quelldatenbank geladen.
  • ETL-Prozess: Daten wurden aus der Quelldatenbank extrahiert, transformiert und in ein Data Warehouse geladen.
  • Datenanalyse: Durchführung einer explorativen Datenanalyse und experimenteller Machine Learning Ansätze.
  • Archivierung: Veröffentlichung des Projekts als Release im GitHub Repository und Archivierung auf Zenodo.

Ergebnisse

Die Analyseergebnisse und erstellten Plots sind im GitHub Wiki dokumentiert.

Systemumgebung

Die Skripte wurden in Python und SQLite erstellt, mit Google Colab als Entwicklungsumgebung. Alle Informationen zur Systemumgebung sind im [Wiki - Systemumgebung) dokumentiert.

Projektausführung

Um die Projektausführung nachzuvollziehen, führen Sie die Notebooks in der angegebenen Reihenfolge online in Google Colab oder lokal auf Ihrem Rechner aus:

  1. Setup_and_fill_Database.ipynb
  2. ETL_Process.ipynb
  3. Data_Analysis.ipynb

Viel Erfolg bei der Exploration unseres Projekts! Bei Fragen stehen wir gerne zur Verfügung.

About

No description, website, or topics provided.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published