Conception d'espaces latents interprétables pour la médecine de précision : applications en neuroimagerie multimodale
Designing interpretable latent spaces for precision medicine : applications in multimodal neuroimaging
- Apprentissage de représentations
- Neuroimagerie multimodale
- IA explicable (XAI)
- Maladies neurodégénératives
- Stratification des patients
- Apprentissage profond
- Apprentissage profond
- Neuroimagerie
- Intelligence artificielle en médecine
- Intelligence artificielle générative
- Intelligence artificielle explicable
- Maladies neurodégénératives
- Maladie d'Alzheimer
- Démence présénile
- Maladies cérébrovasculaires
- Apprentissage profond
- Neuroimagerie
- Intelligence artificielle
- Maladies neurodégénératives
- Maladie d'Alzheimer
- Démence frontotemporale
- Accident vasculaire cérébral
- Representation Learning
- Multimodal Neuroimaging
- Explainable AI (XAI)
- Neurodegenerative Diseases
- Patient Stratification
- Deep Learning
- Langue : Français
- Discipline : Informatique
- Identifiant : 2025ULILS036
- Type de thèse : Doctorat
- Date de soutenance : 09/12/2025
Résumé en langue originale
L’essor du deep learning et l’accès croissant à des volumes massifs de données médicales — diagnostics, traitements, informations génétiques, antécédents cliniques, imagerie ou encore comptes rendus textuels — transforment profondément la recherche biomédicale. Cette abondance ouvre des perspectives inédites pour la médecine de précision : identifier des patients présentant des profils similaires, anticiper l’évolution des pathologies et adapter les prises en charge de façon individualisée. Néanmoins, exploiter efficacement ces données reste un défi majeur. Leur hétérogénéité et leur complexité exigent de concevoir des représentations capables de refléter fidèlement les similarités et dissimilarités entre individus, tout en restant exploitables dans un cadre clinique.Dans ce contexte, les espaces latents offrent un cadre méthodologique particulièrement pertinent. En projetant des données médicales complexes dans des espaces de dimension réduite, ils permettent de condenser l’information tout en préservant sa structure essentielle. Le développement d’espaces latents structurés et interprétables, adaptés au domaine médical, constitue le coeur de cette thèse. De plus, comme les données médicales sont par nature hétérogènes, l’intégration progressive de la multimodalité en représente un prolongement naturel. La première partie introduit les fondements conceptuels des espaces latents et les principales méthodes permettant de les construire, d’abord dans un cadre unimodal puis multimodal. Une attention particulière est portée à leur structuration, une condition essentielle pour concilier fidélité, généralisation et interprétation clinique. Une brève revue des applications existantes en neuroimagerie vient compléter cette mise en contexte. La deuxième partie s’appuie sur le modèle BrainAGE afin de démontrer qu’un espace latent appris de manière supervisée peut encoder des dimensions cliniquement pertinentes. Cette approche a permis d’identifier des sous-groupes de patients dans la maladie d’Alzheimer à début précoce, indépendamment des caractéristiques cliniques conventionnelles, mettant en évidence le potentiel des représentations latentes à saisir la complexité des dimensions phénotypiques. Les troisième et quatrième parties présentent le PatientSpace, un cadre méthodologique destiné à construire des espaces latents interprétables dans le contexte des maladies neurodégénératives. Appliqué initialement à l’imagerie par résonance magnétique (IRM) de patients atteints de démences fronto-temporales (DFT), le PatientSpace a permis d’identifier des sous-groupes cohérents tout en fournissant une explicabilité clinique des regroupements. L’approche a ensuite été étendue à plusieurs démences, notamment Alzheimer et DFT, et enrichie d’une dimension multimodale en intégrant à la fois des données IRM et de tomographie par émission de positons (TEP). Ces travaux ont démontré la robustesse de la méthode et sa capacité à capturer la variabilité interindividuelle tout en restant exploitable dans un cadre clinique. Enfin, la cinquième partie explore un cadre multimodal plus hétérogène, appliqué à la prédiction du pronostic fonctionnel à trois mois après un AVC chez des patients candidats à une thrombectomie. En combinant des séquences IRM (FLAIR et DWI), des comptes rendus radiologiques et des données cliniques, les espaces latents ont été structurés de manière à mettre en évidence le rôle et les interactions de chaque modalité dans la prédiction du mRS à 3 mois. L’intégration de ces sources via des mécanismes d’attention et de gating a non seulement amélioré la performance prédictive, mais aussi permis de quantifier l’apport spécifique de chaque modalité, fournissant ainsi une interprétation directement exploitable en pratique clinique [...]
Résumé traduit
The rise of deep learning and the increasing availability of large-scale medical data—diagnoses, treatments, genetic information, clinical histories, imaging, and textual reports—are profoundly transforming biomedical research. This abundance opens unprecedented opportunities for precision medicine: identifying patients with similar profiles, anticipating disease progression, and tailoring individualized care. However, effectively leveraging these data remains a major challenge. Their heterogeneity and complexity require the design of representations capable of accurately reflecting similarities and differences between individuals, while remaining clinically actionable. In this context, latent spaces provide a particularly relevant methodological framework. By projecting complex medical data into lower-dimensional spaces, they allow information to be condensed while preserving its essential structure. The development of structured and interpretable latent spaces, specifically adapted to the medical domain, constitutes the core of this doctoral research. Moreover, as medical data are inherently heterogeneous, the progressive integration of multimodal sources represents a natural extension of this approach. The first part introduces the conceptual foundations of latent spaces and the main methods for their construction, initially in a unimodal and then in a multimodal framework. Particular attention is given to their structuring, which is essential to balance fidelity, generalization, and clinical interpretability. A brief review of existing applications in neuroimaging complements this context. The second part builds on the BrainAGE model to demonstrate that a supervisedly learned latent space can encode clinically relevant dimensions. This approach enabled the identification of patient subgroups in early onset Alzheimer’s disease independently of conventional clinical features, highlighting the potential of latent representations to capture the complexity of phenotypic dimensions. The third and fourth parts present PatientSpace, a methodological framework for constructing interpretable latent spaces in the context of neurodegenerative diseases. Initially applied to magnetic resonance imaging (MRI) of patients with frontotemporal dementia (FTD), PatientSpace enabled the identification of coherent subgroups while providing clinical interpretability of the clusters. The approach was then extended to multiple dementias, including Alzheimer’s and FTD, and enriched with a multimodal dimension by integrating both MRI and positron emission tomography (PET) data. These studies demonstrated the robustness of the method and its ability to capture inter-individual variability while remaining clinically interpretable. Finally, the fifth part explores a more heterogeneous multimodal setting, applied to predicting three-month functional outcomes after stroke in patients eligible for thrombectomy. By combining MRI sequences (FLAIR and DWI), radiology reports, and clinical data, latent spaces were structured to highlight the role and interactions of each modality in predicting the three-month modified Rankin Scale (mRS). Integration of these sources through attention and gating mechanisms not only improved predictive performance but also allowed quantification of the specific contribution of each modality, providing interpretations directly actionable in clinical practice.Overall, these works advance the exploitation and structuring of latent spaces in medical contexts, paving the way for interpretable and clinically relevant representations, and supporting the development of novel approaches for diagnosis, prognosis, and personalized medicine.
- Directeur(s) de thèse : Lopes, Renaud - Kuchcinski, Grégory
- Président de jury : Pruvo, Jean-Pierre
- Membre(s) de jury : Frindel, Carole - Chételat, Gaël
- Rapporteur(s) : Lemasson, Benjamin - Lecler, Augustin
- Laboratoire : PLBS - Plateformes Lilloises en Biologie & Santé - Plateformes Lilloises en Biologie et Santé - UAR 2014 - US 41
- École doctorale : École doctorale Biologie-Santé
AUTEUR
- Manouvriez, Dorian



