Titre original :

Performance d’un grand modèle de langage (LLM) open-source pour l’extraction d’information depuis des comptes-rendus d’IRM cérébrale

Mots-clés en français :
  • Céphalées
  • IRM
  • compte-rendu
  • intelligence artificielle
  • GPT
  • modèle de langage
  • NLP

  • Céphalée
  • Imagerie par résonance magnétique
  • Urgences médicales
  • Intelligence artificielle en médecine
  • Céphalées
  • Imagerie par résonance magnétique
  • Médecine d'urgence
  • Intelligence artificielle
  • Langue : Français
  • Discipline : Médecine. Radiodiagnostic et imagerie médical
  • Identifiant : 2024ULILM159
  • Type de thèse : Doctorat de médecine
  • Date de soutenance : 17/06/2024

Résumé en langue originale

Introduction : L'utilisation de l'IRM en urgence pour céphalées est en augmentation en Europe et aux États-Unis. Cependant, le rendement diagnostique de cet examen est débattu, avec un taux de positivité probablement faible, autour de 15%. Il n'existe pas d'outil pour automatiser le traitement des comptes-rendus d'IRM dans le but de calculer automatiquement cet indicateur. L'émergence des grands modèles de langage de type GPT a révolutionné le traitement du langage naturel, mais leur caractère fermé est un frein à leur déploiement en vie réelle. Notre objectif était d'utiliser Vicuna, un grand modèle de langage open-source, dans le but d'extraire automatiquement des données depuis des comptes-rendus textuels non structurés. Matériel et méthodes : Tous les comptes-rendus consécutifs d'IRM cérébrales réalisées en urgence du CHU de Lille en 2022 ont été examinés rétrospectivement par quatre radiologues pour en extraire quatre variables : l’indication, l’injection de produit de contraste, le caractère normal ou non de l’examen, et le caractère causal ou non de l’anomalie décrite. Parallèlement, Vicuna, un grand modèle de langage open-source, a effectué les mêmes tâches. Résultats : Un total de 2398 comptes rendus d'IRM cérébrales réalisées en urgence ont été identifiées, dont 595 incluaient une céphalée dans leur indication. Notre méthode basée sur un modèle de langage avait une excellente précision (> 95 %) pour des tâches simples d'extraction d'informations depuis le compte-rendu telles que le sexe et l'âge du patient, l'injection de produit de contraste et la catégorisation de l'examen comme normal ou anormal d'après sa conclusion. La précision de Vicuna était également très bonne (82 %) pour la tâche la plus complexe d'inférence de causalité entre une anomalie décrite à l'IRM et la céphalée. Conclusion : Nous avons montré qu'un modèle de langage de type GPT open-source peut extraire des informations de comptes-rendus radiologiques avec une excellente précision sans nécessiter d'entraînement spécifique. Cette méthode ne nécessite pas d'entraînement supplémentaire, peut être utilisée et partagée gratuitement, et respecte la protection des données de santé.

  • Directeur(s) de thèse : Kuchcinski, Grégory

AUTEUR

  • Le Guellec, Bastien
Droits d'auteur : Ce document est protégé en vertu du Code de la Propriété Intellectuelle.
Accès libre