Titre original :

Boosting Unsupervised Analysis in Molecular and Elemental Hyperspectral Imaging Through Chemometrics

Titre traduit :

Renforcement de l'analyse non supervisée dans l'imagerie hyperspectrale moléculaire et élémentaire grâce à la chimiométrie

Mots-clés en français :
  • Imagerie hyperspectrale
  • Clustering
  • Chimiometrie
  • Maldi
  • Libs
  • Apprentissage machine

  • Imagerie hyperspectrale
  • Chimiométrie
  • Clustering (intelligence artificielle)
  • Traitement d'images -- Techniques numériques
  • Spectroscopie sur plasma induit par laser
  • Apprentissage non supervisé (intelligence artificielle)
  • Fusion multicapteurs
Mots-clés en anglais :
  • Hyperspectral imaging
  • Clustering
  • Chemometrics
  • Maldi
  • Libs
  • Machine learning

  • Langue : Anglais
  • Discipline : Chimie théorique, physique, analytique
  • Identifiant : 2025ULILR023
  • Type de thèse : Doctorat
  • Date de soutenance : 26/09/2025

Résumé en langue originale

Aujourd'hui, l'imagerie hyperspectrale (HSI) joue un rôle clé en chimie analytique. Le défi consiste ainsi à améliorer à la fois la résolution spatiale et spectrale ainsi que la vitesse d'acquisition. Dans ce contexte, la chimiométrie joue un rôle essentiel en tant qu'outil pertinent pour extraire des informations significatives à partir des données. Le MALDI et le LIBS peuvent être considérés comme les techniques les plus utilisées pour l'imagerie moléculaire et élémentaire respectivement. Bien que ces techniques partagent le même problème lié à la dimension des données, les différences dans le processus d'acquisition, le type de données, le stockage des données ainsi que les objectifs d'analyse expliquent la nécessité de recourir à des outils différents pour ces deux modalités.Dans le cas du MALDI, en tant qu'analyse non ciblée, le clustering est rapidement devenu l'une des techniques les plus importantes étudiées en raison de sa capacité à regrouper des objets similaires, par exemple des régions similaires dans une image MALDI. Dans le cadre du diagnostic, les tissus sont généralement examinés selon une méthode de référence comme l'analyse histopathologique ou l'immunohistochimique. Cependant, ces analyses étant ciblées, elles ne sont pas adaptées si l'on cherche de nouveaux biomarqueurs. En effet, le MALDI peut fournir des informations biologiques complètes avec une bonne résolution spatiale. Avec cette masse d'informations, il est possible de segmenter l'image en régions ayant des informations biochimiques similaires. Une technique courante consiste à suivre l'annotation histologique pour regrouper les données à l'aide d'une technique de clustering hiérarchique interactive (bisecting k-means), ou même, en l'absence d'annotation histologique, la segmentation est principalement guidée par l'expérience de l'utilisateur, ce qui peut introduire un biais important.Pour cette raison, l'un des principaux objectifs de cette recherche était de trouver une approche chimiométrique appropriée pour regrouper les données MALDI de manière moins biaisée, en utilisant une approche hiérarchique, en donnant toutes les branches à étudier et en évaluant leur division sans utiliser d'information préalable comme l'annotation histologique ou des présupposés.Le LIBS est largement utilisé dans divers domaines. Des millions de spectres peuvent être mesurés chaque jour, ce qui représente un véritable défi pour l'analyse des ensembles de données. Dans le domaine de l'analyse minérale par exemple, un échantillon peut contenir plusieurs phases et différents minéraux peuvent avoir des compositions élémentaires très proches, rendant l'analyse des données particulièrement difficile. Même si la composition ne semble pas différente, elle peut apparaître différente visuellement. Cette divergence est importante à étudier car elle peut aider à mieux comprendre et explorer de tels échantillons.Pour cette raison, l'approche de fusion de données HSI entre les imagerie LIBS et RGB a été explorée pour améliorer l'analyse LIBS d'échantillons complexes. De plus, la possibilité de fusionner des informations élémentaires et moléculaires dans un contexte biologique est en cours d'exploration. En tant que techniques les plus utilisées dans leurs domaines respectifs, la fusion entre le MALDI et le LIBS peut améliorer l'exploration des tissus biologiques, en permettant de corréler les informations élémentaires et moléculaires, avec la possibilité de comprendre si des modifications élémentaires exogènes peuvent entraîner des variations moléculaires liées à des maladies par exemple.Comme il s'agit d'une étude préliminaire, nous avons commencé avec un échantillon sagittal de cerveau de rat pour évaluer la faisabilité de la technique. Étant donné l'état de l'art, le travail ne s'est pas tant concentré sur le développement de méthodes avancées entièrement nouvelles, mais plutôt sur un changement d'approche et une reformulation de la question de recherche.

Résumé traduit

Today, hyperspectral imaging (HSI) plays a key role among the analytical techniques. The challenge is to improve both spatial and spectral resolution as well as acquisition speed. In this situation, chemometrics plays a key role as a relevant tool to extract meaningful information from the data. MALDI and LIBS can be considered the most used in molecular and elemental imaging respectively. Although they share the same problem of data dimension, the different data acquisition process, the different type of data, data storage, as well as the different purpose of analysis explain the need for different tools between LIBS and MALDI. In MALDI, as a non-target analysis, clustering has more quickly become one of the most important techniques studied due to its ability to group similar objects, e.g. similar region in a MALDI image. In diagnosis, tissues are usually examined by the golden standard of histopathological and immunohistochemical analysis. However, these are targeted analyses, so they are not suitable if we are looking for new biomarkers. In fact, MALDI can provide complete spatially resolved biological information. With this amount of information it is possible to segment the image to a region with similar biochemical information. A common technique it is to follow the histological annotation to cluster the data with an interactive hierarchical clustering technique (bisecting kmeans), or even if there is no histological annotation the segmentation is mainly driven by the user experience, so it can be really biased. For this reason, one of the main purposes of this research was to find an appropriate chemometric approach to cluster the MALDI data in a less biased way, using a hierarchical approach, giving all the sheets to be studied and evaluating their division without using prior information such as histological annotation to match or premonitions. LIBS is widely used in various fields. Millions of spectra can be measured every day, which is a real challenge for data set analysis. In the field of mineral analysis, a sample can contain multiple phases and different minerals can have very close elemental compositions, making data analysis really difficult. Even if the composition does not appear to be different, they can appear to be different from a visual perspective. This discrepancy is important to investigate because it can help to really understand and explore the sample. For this reason, the HSI data fusion approach with LIBS and RGB has been explored to enhance the LIBS analysis. In addition, the possibility of fusing elemental and molecular information in a biological context is being explored. As the most used in its field, the fusion between MALDI and LIBS can enhance the exploration of biological tissue, allowing elemental and molecular information to be correlated, with the possibility of understanding whether exogenous elemental modifications can cause molecular variations related to disease. As this is a pioneering study, we started with a rat sagittal brain sample to see the feasibility of the technique. Given the state of the art, the work was not so much focused on developing brand new advanced methods, but rather on changing the approach and pose the right research question.

  • Directeur(s) de thèse : Duponchel, Ludovic - Ogrinc, Nina
  • Président de jury : Marini, Federico
  • Membre(s) de jury : Fabre, Cécile - Motto-Ros, Vincent
  • Rapporteur(s) : Ziemons, Eric - Amigo, José Manuel - Bordel, Nerea
  • Laboratoire : Laboratoire Avancé de Spectroscopie pour les Interactions, la Réactivité et l'Environnement (LASIRE)
  • École doctorale : École doctorale Sciences de la matière, du rayonnement et de l'environnement (Lille ; 1992-....)

AUTEUR

  • Guerrini, Ruggero