Amplification d’un signal de pharmacovigilance à partir d’un entrepôt de données hospitalier : application à la détection des cas d’infections bactériennes associées à la prise d’anti-inflammatoires non stéroïdiens
- Pharmacovigilance
- entrepôt de données hospitalier
- anti-inflammatoires non stéroïdiens
- Anti-inflammatoires non stéroïdiens
- Maladies bactériennes
- Pharmacovigilance
- Entrepôts de données
- Anti-inflammatoires non stéroïdiens
- Infections bactériennes
- Pharmacovigilance
- Échange d'informations de santé
- Langue : Français
- Discipline : Médecine. Santé Publique
- Identifiant : 2025ULILM357
- Type de thèse : Doctorat de médecine
- Date de soutenance : 14/10/2025
Résumé en langue originale
Contexte : En France, l’incidence des cas infections bactériennes associées à une consommation d’anti-inflammatoires non stéroïdiens (AINS) est vraisemblablement sous-estimée. L’identification automatisée d’effets indésirables médicamenteux à partir de données textuelles issues d’un entrepôt de données hospitalier (EDS) permettrait de faciliter le ciblage de cas éligibles à une analyse d’imputabilité. L’objectif de cette étude était de développer et évaluer une méthode de détection de cas potentiels d’infections bactériennes sous AINS, à partir d’un EDS. Matériel et Méthodes : L’EDS du CHU de Lille (INCLUDE) était exploité sur la période de janvier et juillet 2018 et 2023 (1er au 31 inclus). Les données textuelles en provenance des urgences et d’autres unités d’hospitalisation ont été extraites. Un large language model (LLM) était utilisé pour développer une stratégie de détection automatisée de cas éligibles. Le LLM était exécuté à partir d’un prompt visant à détecter d’une part un contexte infectieux et d’autre part une consommation récente d’AINS : 6 caractéristiques binaires étaient testées à travers 64 configurations. Les données de 2018 étaient utilisées pour affiner la stratégie ; les données de 2023 étaient utilisées comme échantillon de test. L’annotation automatisée était évaluée par confrontation à une annotation experte avec double lecture indépendante et consensus en cas de désaccord. Le score F1 était estimé. Résultats : Sur la période étudiée, pour l’échantillon de test, 143 textes médicaux étaient annotés. L’annotation experte retenait 17 (11,9 %) cas éligibles. La proportion d’hommes était de 58,8 % ; la plupart étaient des adultes d’âge médian 42,1 ans (IQR 27,5 – 53,5). La sensibilité était de 88,2 % (15 sur 17 classés éligibles par la référence) et la VPP était de 60,0 % (15 sur 25 classés éligibles par le LLM). Le score F1 était de 71,4 %. Conclusion : Nous avons proposé une méthode préliminaire de détection automatisée de cas potentiels d’infections bactériennes sous AINS à partir d’un l’EDS. Les cas identifiés sont éligibles à une analyse d’imputabilité et pourraient aider à la caractérisation du signal concerné. Celle-ci permettrait la réalisation ultérieure d’études pharmaco-épidémiologiques.
- Directeur(s) de thèse : Bene, Johana
AUTEUR
- Elices-Diez, Julien

