Réutilisation des données de soins premiers : spécificités, standardisation et suivi de la prise en charge dans les Maisons de Santé Pluridisciplinaires
Secondary use of primary care data : specificities, standardization and monitoring of care in multidisciplinary health centers
- Réutilisation des données
- Extract-Transform-Load (ETL)
- Modèle de données commun OMOP
- Soins premiers
- Maison de Santé Pluridisciplinaire (MSP)
- Tableau de bord
- Soins de santé primaires
- Maisons de santé
- Bases de données
- Exploration de données
- Analyse des données
- Data visualisation
- Soins de santé primaires
- Centres de santé communautaires
- Bases de données comme sujet
- Collecte de données
- Fouille de données
- Couplage des dossiers médicaux
- Échange d'informations de santé
- Entreposage de données
- Analyse de données
- Visualisation de données
- Science des données
- Data reuse
- Extract-Transform-Load (ETL)
- OMOP common data model
- Primary care
- Multidisciplinary health center (MHC)
- Dashboard
- Langue : Français
- Discipline : Recherche clinique, innovation technologique, santé publique
- Identifiant : 2024ULILS040
- Type de thèse : Doctorat
- Date de soutenance : 18/11/2024
Résumé en langue originale
Contexte : La réutilisation des données de santé, au-delà de leur usage initial, permet d’améliorer la prise en charge des patients, de faciliter la recherche et d’optimiser le pilotage des établissements de santé. Pour cela, les données sont extraites des logiciels de santé, transformées et stockées dans un entrepôt de données grâce à un processus extract-transform-load (ETL). Des modèles de données communs, comme le modèle OMOP, existent pour stocker les données dans un format homogène,indépendant de la source. Les données de facturation des soins centralisées dans la base nationale (SNDS), les données hospitalières, les données des réseaux sociaux et des forums, et les données de villes ont des sources de données représentatives du parcours de soins des patients. La dernière source de données est encore peu exploitée. Objectif : L’objectif de cette thèse a été d’intégrer les spécificités de la réutilisation des soins premiers pour implémenter un entrepôt de données, tout en montrant la contribution des soins premiers au domaine de la recherche. Méthodes : Dans un premier temps, les données de soins premiers d’une maison de santé ont été extraites du logiciel de soins WEDA. Un entrepôt de données de soins premiers a été implémenté à l’aide d’un processus ETL. La transformation structurelle (harmonisation de la structure de la base de données) et sémantique (harmonisation du vocabulaire utilisé dans les données) ont été mises en place pour aligner les données avec le modèle de données commun OMOP. Pour intégrer les données des médecins généralistes de plusieurs maisons de santé, un outil de généralisation des processus ETL a été développé et testé sur quatre maisons de santé. Par la suite, un algorithme d’évaluation de la persistance à un traitement prescrit et des tableaux de bord ont été développés. Grâce à l’utilisation du modèle OMOP, ces outils sont partageables avec d’autres maisons de santé. Enfin, des études rétrospectives ont été réalisées sur la population de patients diabétiques des quatre maisons de santé. Résultats : Sur plus de 20 ans, les données des 117 005 patients de quatre maisons de santé ont été chargées dans le modèle OMOP, grâce à notre outil d’optimisation des processus ETL. Ces données couvrent les résultats de biologie des laboratoires de ville et les données relatives aux consultations de médecins généralistes. Le vocabulaire propre aux soins premiers a été aligné avec les concepts standards du modèle. Un algorithme pour évaluer la persistance à un traitement prescrit par le médecin généraliste,ainsi qu’un tableau de bord pour le suivi des indicateurs de performance (ROSP) et de l’activité du cabinet ont été développés. Basés sur les entrepôt de données des quatre maisons de santé, nous avons décrit le suivi des patients diabétiques. Ces études utilisent les données de résultats de biologie, les données de consultation et les prescriptions médicamenteuses, au format OMOP. Les scripts de ces études et les outils développés pourront être partagés.Conclusion : Les données de soins premiers représentent un potentiel pour la réutilisation des données à des fins de recherche et d’amélioration de la qualité des soins. Elles complètent les bases de données existantes (hospitalières, nationales et réseaux sociaux) en intégrant les données cliniques de ville. L’utilisation d’un modèle de données commun facilite le développement d’outils et la conduite d’études, tout en permettant leur partage. Les études pourront être répliquées dans différents centres,afin de comparer les résultats.
Résumé traduit
Context : Reusing healthcare data beyond its initial use helps to improve patient care, facilitate research, and optimize the management of healthcare organizations. To achieve this, data is extracted from healthcare software, transformed and stored in a data warehouse through an extract-transform-load(ETL) process. Common data models, such as the OMOP model, exist to store data in a homogeneous,source-independent format. Data from healthcare claims centralized in the national database (SNDS), hospital, social networks and forums, and primary care are different data sources representative of the patient care pathway. The last data source has not been fully exploited. Objective : The aim of this thesis was to incorporate the specificities of primary care data reuse to implement a data warehouse while highlighting the contribution of primary care to the field of research. Methods : The first step was to extract the primary care data of a multidisciplinary health center (MHC) from the WEDA care software. A primary care data warehouse was implemented using an ETL process. Structural transformation (harmonization of the database structure) and semantic transformation (harmonization of the vocabulary used in the data) were implemented to align the data with the common OMOP data model. A process generalization tool was developed to integrate general practitioners (GP) data from multiple care structures and tested on four MHCs. Subsequently, algorithm for assessing the persistence of a prescribed treatment and dashboards were developed. Thanks to the use of the OMOP model, these tools can be shared with other MHCs. Finally, retrospective studies were conducted on the diabetic population of the four MHCs. Results : Over a period of more than 20 years, data of 117,005 patients from four MHCs wereloaded into the OMOP model using our ETL process optimization tool. These data include biological results from laboratories and GP consultation data. The vocabulary specific to primary care was aligned with the standard concepts of the model. An algorithm for assessing persistence with treatment prescribed by the GP and also a dashboard for monitoring performance indicators (ROSP) and practice activity have been developed. Based on the data warehouses of four MHCs, we described the follow-up of diabetic patients. These studies use biological results, consultation and drug prescriptions data in OMOP format. The scripts of these studies and the tools developed can be shared. Conclusion : Primary care data represent a potential for reusing data for research purposes and improving the quality of care. They complement existing databases (hospital, national and social networks) by integrating clinical data from the city. The use of a common data model facilitates the development of tools and the conduct of studies, while enabling their sharing. Studies can be replicated in different centers to compare results.
- Directeur(s) de thèse : Lamer, Antoine
- Président de jury : Beuscart, Jean-Baptiste
- Membre(s) de jury : Pelayo, Sylvia - Mougin, Fleur - Rance, Bastien - Folco-Lognos, Béatrice
- Rapporteur(s) : Jouhet, Vianney - Tsopra Tahiraly, Rosy
- Laboratoire : Evaluation des technologies de santé et des pratiques médicales (Lille) - Evaluation des technologies de santé et des pratiques médicales - ULR 2694
- École doctorale : École graduée Biologie-Santé (Lille ; 2000-....)
AUTEUR
- Fruchart, Mathilde