Agre?gation et me?ta-mode?lisation de proce?de?s de me?thanisation : the?orie et algorithmes
Aggregation and meta-modeling of anaerobic digestion : theory and algorithms
- Digestion Anaérobie
- Méta-Apprentissage
- PAC-Bayes
- Bornes de généralisation
- Statistiques Bayésiennes
- Quantification de l'incertitude
- Apprentissage PAC-Bayésien
- Surapprentissage
- Méthanisation
- Statistique bayésienne
- Incertitude (théorie de l'information)
- Anaerobic Digestion
- Meta-Learning
- PAC-Bayes
- Generalisation bounds
- Bayesian statistics
- Uncertainty Quantification
- Langue : Anglais
- Discipline : Mathématiques et leurs interactions
- Identifiant : 2025ULILB007
- Type de thèse : Doctorat
- Date de soutenance : 03/04/2025
Résumé en langue originale
Les technologies de digestion anaérobie (DA) jouent un rôle clé dans la transition vers une énergie propre en convertissant les déchets organiques en biogaz, remplaçant le gaz naturel fossile. Pour optimiser les systèmes de DA, une compréhension précise des mécanismes biologiques et physico-chimiques est nécessaire. L'utilisation de modèles biochimiques constitue une étape dans cette direction, mais ces derniers sont sujets au sur-apprentissage et sont souvent limités au processus sur lequel ils sont calibrés, ce qui limite leur pouvoir prédictif.L'approche PAC-Bayes contrôle intrinsèquement le risque de sur-apprentissage grâce à son utilisation de garanties de généralisation. En tant qu'approche Bayésienne, elle offre de plus la possibilité d'intégrer des connaissances expertes utiles dans le processus d'apprentissage et fournit naturellement une quantification de l'incertitude, bien que cette dernière n'ait plus de garanties théoriques. Cependant, la nature corrélée des données et le coût de calcul élevé des simulations rendent l'application de PAC-Bayes à la DA difficile et nécessitent des adaptations.Dans son état actuel, les connaissances expertes sont insuffisantes pour construire des modèles utilisables pour de nouveaux digesteurs, pour lesquels aucune donnée n'est disponible. Les stratégies de méta-apprentissage offrent une approche prometteuse pour améliorer ces connaissances expertes, en exploitant les informations provenant de plusieurs unités de DA. En apprenant les mécanismes communs entre différentes unités, le méta-apprentissage pourrait aboutir à des modèles plus robustes, notamment pour les sites pour lesquels peu ou pas de données sont disponibles. Cependant, les algorithmes de méta-apprentissage PAC-Bayes existants sont intensifs sur le plan du temps de calcul et mal adaptés aux longs temps de simulation des processus de DA.Cette thèse se concentre sur le développement de méthodes efficaces pour appliquer la théorie PAC-Bayes et les approches de méta-apprentissage à la modélisation de la DA. Elle apporte des nouveaux éléments théoriques sur PAC-Bayes, présente de nouvelles implémentations efficaces des stratégies PAC-Bayes et de méta-apprentissage, et fournit des évaluations expérimentales des modèles stochastiques obtenus.
Résumé traduit
Anaerobic Digestion (AD) technologies play a key role in the transition to cleaner energy by converting organic waste into biogas which can replace fossil natural gas. To optimize AD systems, a thorough understanding of the biological and physicochemical mechanisms is required. Biochemical computational models are a step in this direction but are prone to overfitting and are often specific to the process they are calibrated for, limiting their predictive power.The PAC-Bayes framework inherently limits the risk of overfitting through its reliance on trainable generalisation guarantees. As an extended Bayesian approach, it moreover provides the opportunity to incorporate useful expert knowledge in the learning process, and inherently provides uncertainty quantification, albeit with no theoretical guarantees. However, the correlated nature of the data and the high computational cost of the simulation make the application of PAC-Bayes to AD challenging and require adaptation.In its current state, expert knowledge is insufficient to construct meaningful models for new AD units for which no data is available. Meta-learning strategies offer a promising way to enhance this expert knowledge by leveraging information across multiple AD units. By learning common features across different units, meta-learning could result in more robust models, especially for units when few, or no data is available. Previous PAC-Bayes meta-learning algorithms are however quite computationally intensive, and ill-fitted to the high simulation time of AD processes.This thesis focuses on developing efficient methods for applying PAC-Bayes theory and meta-learning approaches to AD modelling. It contributes theoretical insights into PAC-Bayes, presents efficient implementations of both PAC-Bayes and meta-learning strategies, and provides experimental assessments of the resulting models' predictive power and uncertainty quantification.
- Directeur(s) de thèse : Guedj, Benjamin
- Président de jury : Biau, Gérard
- Membre(s) de jury : Moscoviz, Roman - Hudelot, Céline - Steyer, Jean-Philippe - Gaillard, Pierre
- Rapporteur(s) : Keribin, Christine - Chopin, Nicolas
- Laboratoire : Laboratoire Paul Painlevé - Centre Inria de l'Université de Lille
- École doctorale : École graduée Mathématiques, sciences du numérique et de leurs interactions (Lille ; 2021-....)
AUTEUR
- Picard, Antoine

