Titre original :

Méthode générique d’amélioration de l’interopérabilité des bases de données médicales et écologiques et application sur données françaises

Mots-clés en français :
  • Analyse spatiale
  • réutilisation de données
  • change of support problem
  • interopérabilité

  • Médecine
  • Bases de données spatio-temporelles
  • Écologie -- Bases de données
  • Programme de médicalisation des systèmes d'information
  • Analyse spatiale (statistique)
  • Bases de données comme sujet
  • Informatique médicale
  • Écologie
  • Analyse spatiale
  • Langue : Français
  • Discipline : Médecine. Santé Publique
  • Identifiant : 2017LIL2M334
  • Type de thèse : Doctorat de médecine
  • Date de soutenance : 20/09/2017

Résumé en langue originale

Introduction La disponibilité de base de données de grandes dimensions et le développement important de la réutilisation de données et du géoréférencement ont ouvert des perspectives dans l’analyse spatiale en santé. Cependant, les études à fine échelles avec des données écologiques et médicales sont limitées par le change of support problem et le manque d’interopérabilité entre unités spatiales. Les méthodes de désagrégation spatiale pour résoudre ce problème introduisent des erreurs dans l’estimation spatiale. De plus, il existe un manque de cadre d’étude dans ces situations. Nous présentons ici une méthode générique d’agrégation à 2 étapes permettant de fusionner des bases de données médicales et écologiques avec un schéma standard sans utiliser de modèles de désagrégation spatiale tout en maximisant la résolution spatiale. Méthode Premièrement une table de correspondance est construite après identification d’une ou plusieurs matrices de passage. Cette table relie les unités spatiales des bases de données originales avec les unités spatiales de la base de données finale. Deuxièmement, la table de correspondance est validée par la comparaison de variables contenues dans les 2 bases de données initiales et la vérification de la validité spatiale avec un critère de continuité spatiale et un critère de résolution spatiale. Résultats Nous avons utilisé cette méthode pour fusionner une base de données médicales (le programme médicalisé des systèmes d’information contenant 5644 unités spatiales) avec une base de données écologiques (issue de l’institut national de la statistique et des études économiques contenant 36594 unités spatiales). La table de correspondance finale aboutit à 5632 unités spatiales finales. Elle a été validée par la comparaison du nombre de naissances dans la base de données médicales et dans la base de données écologiques pour chaque unité spatiale finale. La médiane [intervalle inter-quartile] de la différence relative était de 2,3% [0 ; 5,7]. Le critère de continuité spatiale était faible (2,4%) et l’indice de résolution spatiale était meilleur que pour la plupart des unités administratives françaises. Conclusions Notre approche innovant améliore l’interopérabilité entre bases de données médicales et écologiques et facilite l’analyse spatiale à fine échelle. Nous avons montré que les modèles de désagrégation et les larges agrégations n’étaient pas nécessairement les meilleures façons de répondre au change of support problem.

Résumé traduit

...

  • Directeur(s) de thèse : Genin, Michaël

AUTEUR

  • Ghenassia, Adrien
Droits d'auteur : Ce document est protégé en vertu du Code de la Propriété Intellectuelle.
Accès libre