Titre original :

Apport de l’apprentissage automatique dans l’exploitation des volumineuses bases de données électroniques de santé : application à la prédiction de mortalité dans la base FRANCE TAVI

Mots-clés en français :
  • TAVI
  • machine learning
  • apprentissage automatique
  • valvulopathie
  • prédiction

  • Valvulopathies
  • Prothèses valvulaires cardiaques
  • Mortalité
  • Médecine -- Bases de données
  • Apprentissage automatique
  • Remplacement valvulaire aortique par cathéter
  • Bases de données factuelles
  • Apprentissage machine
  • Langue : Français
  • Discipline : Médecine. Cardiologie et maladies vasculaires
  • Identifiant : 2018LILUM396
  • Type de thèse : Doctorat de médecine
  • Date de soutenance : 23/10/2018

Résumé en langue originale

Contexte : La régression logistique a été utilisée pour bâtir le Euroscore I et II, et STS score. Ces outils sont actuellement communément utilisés pour estimer la probabilité de mortalité péri-opératoire du remplacement valvulaire aortique percutané. Mais leur performance est remise en question. Les outils prédictifs d’apprentissage automatique (« machine learning », ML) ont le potentiel d’être plus performants. L’objectif de cette étude était de comparer les performances prédictives des algorithmes de ML par rapport à la régression logistique ainsi que les scores actuellement utilisés. Méthode : Les données cliniques et de mortalité ont été extraites du registre FRANCE TAVI. Les données manquantes ont été traitées par imputation multiple. Les variables associées en univarié à la mortalité péri-opératoire et à 1 an ont été prises en compte dans la construction des modèles prédictifs (p<0.2). Un modèle de régression logistique multivarié a été construit à partir des données FRANCE-TAVI pour servir de comparateur. Les modèles de ML à l’étude étaient la régression pénalisée, Random Forest, Naïve Bayes, Neural Network (NN), support vector machine (SVM). Une base d’entrainement (2/3 de FRANCE-TAVI) a servi à l’entrainement des modèles avec validation-croisée. Les modèles étaient ensuite testés sur une base test (1/3 de FRANCE-TAVI). Les logiciels R et SPSS 23 ont été utilisés pour l’analyse. Résultats : Les données des 12806 patients du registre FRANCE-TAVI ont été analysées. L’âge médian (intervalle interquartile) des patients était 84 (80-88). Les Euroscore I, II et STS score médians étaient 15 (9.5-23.0), 4.8 (2.9-8.0), 6.1 (3.6-13.0) respectivement. La mortalité péri-opératoire était de 4.3%, et la mortalité à un an était 14.4%. L’AUC (aire sous la courbe) était <0.6 pour Euroscore I, Euroscore II et STS score et leur sensibilité était <6%. Tous les modèles de ML avaient une AUC >0.6. Le modèle NN avait les meilleures performances prédictives de mortalité péri-opératoire (AUC 0.65, sensibilité 0.52). Le modèle SVM avait les meilleures performances prédictives de mortalité à 1 an (AUC 0.63, sensibilité 0.46). Conclusion : Les outils de ML sont supérieurs à la régression logistique pour la prédiction de la mortalité après remplacement valvulaire aortique percutané. A l’ère de la médecine de précision les outils de ML tels que NN et SVM devraient être considérés la prédiction de mortalité.

Résumé traduit

...

  • Directeur(s) de thèse : Modine, Thomas

AUTEUR

  • Overtchouk, Pavel
Droits d'auteur : Ce document est protégé en vertu du Code de la Propriété Intellectuelle.
Accès réservé aux membres de l'Université de Lille sur authentification