Titre original :

Novel chemometric tools for the unmixing of complex mixtures in spectral imaging considering spatial-spectral information and their interplay

Titre traduit :

Nouveaux outils chimiométriques pour le démélange de mélanges complexes en imagerie spectrale en tenant compte des informations spatio-spectrales et de leur interaction

Mots-clés en français :
  • Corrélation spatiale

  • Imagerie hyperspectrale
  • Chimiométrie
  • Analyse multivariée
  • Analyse en composantes principales
  • Moindres carrés
  • Traitement d'images -- Techniques numériques
Mots-clés en anglais :
  • Hyperspectral images
  • Spatial features
  • Multivariate image analysis

  • Langue : Anglais
  • Discipline : Chimie théorique, physique, analytique
  • Identifiant : 2023ULILR017
  • Type de thèse : Doctorat
  • Date de soutenance : 05/05/2023

Résumé en langue originale

L'imagerie hyperspectrale est utilisée dans de nombreux domaines scientifiques en raison de sa capacité efficace à acquérir des informations dans les domaines spatial et spectral. Les applications vont de l'imagerie cellulaire en biologie à la télédétection en sciences agricoles. Cependant, dans de nombreuses applications et méthodes, les informations contenues dans l'image spectrale ne sont pas pleinement exploitées, ce qui conduit à des résultats non optimaux. L'un des problèmes les plus importants est la corrélation spatiale, qui est soit complètement ignorée, soit insuffisamment prise en compte. En fait, la dimension spatiale est généralement dépliée en pixels pour fournir une matrice de données bidimensionnelle avant l'application de méthodes chimiométriques, telles que la décomposition par l'analyse en composantes principales (ACP) ou la résolution multivariée des courbes alternées des moindres carrés (MCR-ALS). Dans le cadre du projet de thèse, de nouveaux outils ont été développés afin de prendre en compte simultanément les dimensions spatiales et spectrales et d'améliorer la résolution des mélanges dans des situations complexes, où les outils actuels ne sont pas toujours en mesure de trouver des solutions adéquates.Le premier outil développé a été appelé Image Decomposition, Encoding and Localisation (IDEL), et adopte une approche spatiale de l'analyse des images spectrales, tout en maintenant le lien avec les profils spectraux qui sont responsables des modèles spatiaux observés. IDEL exploite une phase basée sur le filtre d'ondelettes, combinée à une phase de compression basée sur le codage d'image et l'analyse de données multivariées, et une reconstruction finale dans le domaine original des informations spatiales-spectrales les plus essentielles. IDEL a été appliqué à plusieurs benchmarks décrivant différentes situations, simulées et réelles. Dans un premier temps, des simulations ont été mises en place pour appliquer l'approche de manière contrôlée, avant de passer à des études de cas réels stimulants, tels que la reconnaissance de traces biologiques dispersées sur différentes surfaces dans le contexte de l'analyse médico-légale ou la distribution de composants alimentaires dans le contrôle de la qualité des aliments. Les résultats ont démontré la capacité de la méthodologie, en offrant une nouvelle perspective sur des données qui étaient auparavant difficiles à comprendre. Le second outil résout le problème très critique des composants minoritaires dans les mélanges, que l'algorithme standard MCR-ALS ne parvient pas à récupérer, surtout en présence de bruit. La méthode proposée est basée sur un schéma de pondération calibré à la pertinence de l'échantillon (d'une composition de mélange donnée) par rapport au degré de pureté que chaque échantillon représente. Ce nouvel outil, appelé "MCR-ALS pondéré", a été testé sur des données simulées, puis appliqué à l'image pseudo-réelle d'un comprimé pharmaceutique, ce qui a permis d'obtenir des avantages significatifs par rapport à l'état actuel de la technique. Les deux outils ont été codés en MATLAB. La fonction IDEL a été développée en incluant un ensemble de paramètres prédéfinis, applicables dans différentes situations et prêts à être utilisés par des non-experts dans le domaine. En même temps, le paramétrage peut être géré par des utilisateurs expérimentés. Ces deux outils sont conçus pour fonctionner dans un large éventail de situations.

Résumé traduit

Hyperspectral imaging is used in many fields of science, for its powerful ability to gather information in both the spatial and spectral domain. Applications range from cell imaging in biology to remote sensing in agricultural sciences. However, in many applications and methods, the information within the spectral image is not fully utilized, leading to sub-optimal results. One of the more prominent concerns is spatial correlation, as it is either completely disregarded or considered in a sub-optimal way. In fact, the spatial dimension is usually unfolded pixelwise to provide a two-dimensional data matrix prior to applying chemometric methods, such as decomposition by Principal Component Analysis (PCA) or Multivariate Curve Resolution-Alternating Least Squares (MCR-ALS). In the thesis project, novel tools have been developed to simultaneously consider the spatial and spectral dimensions, as well as to improve mixture resolution in challenging situations, where current tools might fail to retrieve adequate solutions. The first developed tool is named Image Decomposition, Encoding and Localization (IDEL) which takes a spatial approach to spectral image analysis maintaining the link to the spectral features which are responsible for the observed spatial patterns. IDEL combines an exploitation step based on wavelet filters, with a compression step based on image encoding and multivariate data analysis, and a final reconstruction in the original domain of the most essential spatial-spectral information. IDEL has been applied on several benchmarks representing a varied set of situations, simulated and real. At first, simulations were developed to apply the approach in a controlled manner, then moving to challenging real case studies i.e., recognition of biological traces dispersed on different surfaces in the context of forensic analysis, or food component distributions in food quality control. Results showed the capability of the methodology, obtaining a new perspective on the data that was previously difficult to access. The second tool tackles the very critical issue of under-represented minor components in mixtures that the standard MCR-ALS algorithm, fails to recover, especially in presence of noise. The proposed method is based on a weighting scheme tuned on sample (of a given mixture composition) relevance with respect to degree of purity each sample represents. This novel tool, named weighted MCR-ALS has been tested in simulated data, and then applied to a pseudo real image of a pharmaceutical tablet, where considerable gains are obtained, with respect to the current state-of-the art. Both tools have been coded in MATLAB. The IDEL function has been developed including a default set of parameters that are applicable in different situations and ready to be utilized by non-experts of the field. At the same time parameter tuning can be handled by the expert users. Both tools are set up to work across a broad range of situations.

  • Directeur(s) de thèse : Ruckebusch, Cyril - Cocchi, Marina
  • Président de jury : Walczak, Beata
  • Membre(s) de jury : Duponchel, Ludovic - Durante, Caterina - Marini, Federico
  • Rapporteur(s) : Walczak, Beata - Amigo, José Manuel
  • Laboratoire : Laboratoire Avancé de Spectroscopie pour les Interactions, la Réactivité et l'Environnement (LASIRE)
  • École doctorale : École doctorale Sciences de la matière, du rayonnement et de l'environnement (Villeneuve d'Ascq, Nord)

AUTEUR

  • Ahmad, Mohamad
Droits d'auteur : Ce document est protégé en vertu du Code de la Propriété Intellectuelle.
Accès libre