Titre original :

Design and development of intelligent air quality indicators for environmental and health preservation support

Titre traduit :

Conception et développement d’indicateurs intelligents de qualité de l’air pour soutenir la préservation de l’environnement et de la santé

Mots-clés en français :
  • Intelligence artificielle
  • Qualité de l'air
  • Calcul granulaire
  • Apprentissage par transfert
  • Prévision de la toxicité des particules
  • Intelligence artificielle explicable (XAI)

  • Indicateurs de la qualité de l'air
  • Surveillance de l'environnement
  • Risques pour la santé
  • Risques écotoxicologiques
  • Systèmes d'aide à la décision
  • Apprentissage profond
  • Réseaux neuronaux (informatique)
Mots-clés en anglais :
  • Artificial intelligence
  • Air quality
  • Granular computing
  • Transfer learning
  • Particulate matter toxicity prediction
  • Explainable artificial intelligence (XAI)

  • Langue : Anglais
  • Discipline : Informatique, Automatique
  • Identifiant : 2025ULILB015
  • Type de thèse : Doctorat
  • Date de soutenance : 26/09/2025

Résumé en langue originale

La pollution atmosphérique constitue une menace mondiale croissante pour la santé publique et la durabilité environnementale, les systèmes de surveillance traditionnels peinant à fournir des informations précises pour une prise de décision efficace. Cette thèse développe des indicateurs intelligents de qualité de l'air intégrant l'IA aux sciences environnementales pour la préservation environnementale et la protection sanitaire.Cette recherche apporte trois contributions fondamentales. Premièrement, nous introduisons un cadre de calcul granulaire pour la classification explicable de la qualité de l'air transformant les modèles opaques en systèmes transparents d'aide à la décision. L'algorithme AirQ-RuleGrCEx — notre contribution théorique principale — extrait des règles lisibles exploitant le calcul granulaire pour lier conditions météorologiques et qualité de l'air. Cet algorithme atteint une précision compétitive tout en fournissant une interprétabilité sans précédent pour les parties prenantes et décideurs, comblant l'écart entre performance prédictive et transparence décisionnelle.Deuxièmement, nous développons un paradigme d'apprentissage par transfert neuronal à travers trois applications révolutionnant l'efficacité de la prévision. Première application : transfert inter-polluants utilisant des réseaux neuronaux, où des modèles pré-entraînés PM2.5 prédisent d'autres polluants, permettant une modélisation efficace en données rares. Deuxième application : transfert temporel des prévisions horaires aux multi-horizons. Troisième application : notre cadre LagEnsembleForecasting combinant quatre modèles d'apprentissage profond sur différents décalages temporels (1h, 6h, 12h, 24h) pour une précision améliorée et quantification d'incertitude par variance d'ensemble.Troisièmement, nous progressons dans l'évaluation des risques particulaires via la prédiction des seuils de toxicité par apprentissage automatique. Exploitant des données de plus de 40 études, notre cadre emploie cinq algorithmes avec explicabilité SHAP pour distinguer concentrations toxiques/non-toxiques, fournissant des évaluations plus nuancées qu'les méthodes conventionnelles.L'intégration établit un cadre complet de surveillance environnementale intelligente améliorant prédiction, support décisionnel et évaluation des risques sanitaires. La validation confirme l'applicabilité pratique. Les fondements méthodologiques créent une voie vers des stratégies intégrées eau-air-sol pour des systèmes unifiés de gestion environnementale holistique.

Résumé traduit

Air pollution poses an escalating global threat to public health and environmental sustainability, with traditional monitoring systems struggling to provide the timely, accurate, and interpretable information essential for effective decision-making. This thesis addresses these critical limitations by developing intelligent air quality indicators that integrate advanced artificial intelligence techniques with environmental science to create more effective tools for environmental preservation and health protection.This research makes three fundamental contributions to environmental intelligence systems. First, we introduce a novel granular computing framework for explainable air quality classification that transforms opaque machine learning models into transparent decision support systems. We propose the AirQ-RuleGrCEx algorithm as our primary theoretical contribution a groundbreaking approach that systematically extracts human-readable rules by leveraging granular computing principles to explicitly link meteorological conditions to air quality levels. This algorithm represents a significant methodological advancement in the field of explainable AI for environmental applications, achieving competitive accuracy while providing unprecedented interpretability for environmental stakeholders and policymakers. Through systematic development and refinement, we aim to establish this approach as one of the most promising algorithms for interpretable environmental classification, bridging the critical gap between predictive performance and decision transparency.Second, we develop a comprehensive neural transfer learning paradigm through three innovative applications that revolutionize air quality forecasting efficiency and scalability. Our first application demonstrates successful cross-pollutant knowledge transfer using artificial neural networks, where models pre-trained on PM2.5 data are effectively fine-tuned to predict other pollutants, enabling efficient modeling in data-scarce scenarios. The second application extends temporal transfer learning from hourly to multi-horizon forecasting, allowing models to adapt across different prediction timescales with minimal computational overhead. The third application introduces our novel LagEnsembleForecasting framework, which combines four specialized deep learning models trained on different temporal lag sequences (1h, 6h, 12h, 24h) to provide enhanced prediction accuracy and natural uncertainty quantification through ensemble variance, with successful transferability to other pollutants demonstrating the framework's versatility.Third, we advance particulate matter risk assessment through machine learning-driven toxicity threshold prediction, addressing the limitations of costly and time-intensive laboratory approaches. By leveraging a comprehensive dataset compiled from over 40 peer-reviewed studies, our framework employs five complementary algorithms with SHAP-based explainability to distinguish toxic from non-toxic PM concentrations. This approach provides more nuanced toxicity assessments than conventional methods while identifying key compositional factors that drive toxicity outcomes.The integration of these contributions establishes a comprehensive framework for intelligent environmental monitoring that enhances prediction capabilities, provides interpretable decision support, and enables more effective health risk assessment. Validation across multiple real-world datasets confirms the practical applicability and scalability of our approaches. Importantly, while this research focuses primarily on air quality, the methodological foundations and transfer learning principles established here create a pathway toward integrated water-air-soil monitoring strategies, where the same intelligent frameworks could be adapted and extended to create unified environmental management systems that holistically address the interconnected nature of environmental challenges across multiple domains.

  • Directeur(s) de thèse : Zgaya, Hayfa - Canivet, Ludivine - Ben Othman, Sarah
  • Président de jury : Hammadi, Slim
  • Membre(s) de jury : Le Calvé, Stéphane - Rorat, Agnieszka
  • Rapporteur(s) : Forestier, Germain - Teisseire, Maguelonne
  • Laboratoire : Centre de Recherche en Informatique, Signal et Automatique de Lille
  • École doctorale : École graduée Mathématiques, sciences du numérique et de leurs interactions (Lille ; 2021-....)

AUTEUR

  • Jairi, Idriss