Titre original :

Mise au point d'un framework d'analyses statistiques pour la réutilisation des bases de données médico-administratives

Mots-clés en français :
  • Bases de données médico-administratives
  • statistiques
  • épidémiologie des soins
  • programmation en statistiques

  • Santé publique -- Enquêtes
  • Médecine -- Informatique
  • Statistiques médicales
  • Études épidémiologiques
  • Informatique médicale
  • Échange d'informations de santé
  • Langue : Français
  • Discipline : Médecine. Santé Publique
  • Identifiant : 2017LIL2M085
  • Type de thèse : Doctorat de médecine
  • Date de soutenance : 10/04/2017

Résumé en langue originale

Contexte : De nombreuses études épidémiologiques reposent désormais sur la réutilisation de bases de données médico-administratives, même si ces dernières sont encore sous-exploitées. Dans ces études, la majeure partie du temps est consacrée au data management et aux analyses statistiques de base, ne laissant que peu de place pour l’analyse statistique et médicale plus complexe. L’objectif de ce travail était de mettre au point un framework d’analyses statistiques pour faciliter la réutilisation des bases de données médico-administratives. Méthodes : Une revue de la littérature réalisée sur Pubmed a permis d’identifier les indicateurs épidémiologiques les plus fréquents. Elle a été réalisée sur 5 thématiques différentes : les césariennes, les cholécystectomies, les dispositifs d’assistance ventriculaire, les chirurgies de prothèses de hanche et la chirurgie bariatrique. Ces indicateurs ont ensuite été abstraits et ont inspiré le développement de fonctions informatiques programmées en langage R. Ces fonctions visent à traiter et analyser statistiquement des données médicales. Résultats : Au total, 52 articles ont été identifiés concernant l’analyse de grandes bases de données. Des indicateurs épidémiologiques ont ainsi pu être abstraits en fonctionnalités mises en oeuvre au travers de 32 fonctions accessibles à l’utilisateur. Par exemple, une fonction qui affiche un histogramme, calcule la moyenne avec l’intervalle de confiance, les quantiles, etc. Ces fonctions comprennent 4 fonctions de data management, 9 fonctions pour l’analyse univariée, 8 pour l’analyse bivariée, 11 pour l’analyse multivariée et de nombreuses fonctions intermédiaires. Conclusion : Ces fonctions ont été utilisées avec succès pour analyser la base de données nationale du Programme de Médicalisation des Systèmes d’Information composée de 250 millions de séjours hospitaliers. Ce panel de fonctions prêtes à l’emploi a permis de sécuriser les tâches répétitives et de recentrer les efforts sur l’analyse médicale.

Résumé traduit

...

  • Directeur(s) de thèse : Chazard, Emmanuel

AUTEUR

  • Georges, Alexandre
Droits d'auteur : Ce document est protégé en vertu du Code de la Propriété Intellectuelle.
Accès réservé aux membres de l'Université de Lille sur authentification