Titre original :

Biologie des systèmes et intelligence artificielle pour l'identification des réseaux de régulation de l'addiction oncogénique dans le cancer du poumon

Titre traduit :

Explainable AI-based Lung cancer systems biology to decipher regulatory networks of oncogene addiction

Mots-clés en français :
  • Intelligence artificielle
  • Biologie des systèmes du cancer
  • Biologie moléculaire
  • Machine learning
  • Cancer

  • Poumon -- Cancer
  • Tumeurs -- Classification
  • Réseaux de régulation génétique
  • Tyrosine kinases
  • Facteurs de transcription
  • Biologie systémique
  • Apprentissage automatique
  • Intelligence artificielle en médecine
  • Tumeurs du poumon
  • Réseaux de régulation génique
  • Régulation de l'expression des gènes
  • Récepteurs à activité tyrosine kinase
  • Facteurs de transcription
  • Biologie des systèmes
  • Apprentissage machine
  • Intelligence artificielle
Mots-clés en anglais :
  • Systems biology of cancer
  • Artificial intelligence
  • Molecular biology
  • Machine learning
  • Cancer

  • Langue : Français
  • Discipline : Biologie cellulaire et moléculaire
  • Identifiant : 2025ULILS020
  • Type de thèse : Doctorat
  • Date de soutenance : 25/06/2025

Résumé en langue originale

La prise en charge du cancer du poumon repose notamment sur sa classification en sous-types histologiques et moléculaires, caractérisés par la présence ou non d’altérations moléculaires ciblables. Parmi les nombreuses altérations génétiques caractérisées, les mutations du récepteur MET, induisant un saut de l’exon 14 (METex14Del), sont retrouvés dans environ 3% des patients et représentent une nouvelle cible thérapeutique. Cependant, les mécanismes induits par METex14Del pour imposer une addiction oncogénique sont encore mal connus et les réponses aux thérapies ciblées sont perfectibles. Parallèlement, la multiplication des projets de séquençage de grande envergure génère d’importantes ressources « omiques » accessibles dans des bases publiques. Leur exploitation ouvre la voie à des approches de biologie computationnelle pouvant mener à des classifications plus fines à partir du profilage de l’expression génique des tumeurs pulmonaires. Néanmoins la diversité des techniques de séquençage rend difficile leur comparaison directe ou la fusion des données, ne permettant pas de classification unifiée à partie de large jeux de données.Grâce aux approches de biologie des systèmes, et plus particulièrement à l’inférence de réseaux de régulation génique (GRN) appliqués au cancer du poumon, il est possible d’agréger de vastes jeux de données transcriptomiques. L’analyse de ces réseaux permet notamment d’identifier des régulateurs clés et de leur assigner une valeur représentant leur activité régulatrice, l’influence. Dans ce contexte, nous avons développé la plateforme web lung.cRegMap, qui intègre les profils d’expression de lignées cellulaires de cancer du poumon et de plusieurs cohortes comptant 5487 patients. Cette approche a permis de définir sept sous-groupes distincts de cancers du poumon, sur lesquels les données cliniques, moléculaires et histologiques ont été reportées. La classification obtenue est conforme à l’histologie, mais elle révèle également un sous type d’adénocarcinomes de mauvais pronostique et de nouveaux sous-types caractérisés par des signatures d’expression génique mésenchymateuse et neuroendocrine. Chaque groupe se distingue par un ensemble propre de régulateurs clés dont l’importance peut être estimée à partir d’essais de dépendance de ces gènes dans la prolifération et la survie de modèles cellulaires. L’analyse en réseau de régulation et la notion d’influence des noeuds de régulation rend possible l’analyse dynamique du GRN. Nous avons tiré parti de cette originalité de notre approche pour étudier la dynamique de réponse à l’HGF des récepteurs METex14Del. Cette étude a mis en évidence l’activation d’un noeud de régulation majeur constitué de plusieurs facteurs de transcription interconnectés (ETS1, FOSL1, SMAD3) tous régulés par la voie signalisation RAS-ERK. Des validations expérimentales confirment l’implication de ces facteurs de transcriptions dans la régulation de l’expression des gènes induits par METex14Del et le rôle central de la voie RAS-ERK dans la migration et l’invasion cellulaire. Cette voie représente ainsi une cible thérapeutique prometteuse, notamment en cas de réponse incomplète aux inhibiteurs de MET.Dans leur ensemble nos résultats valident la pertinence et la robustesse du modèle en réseau de régulation du cancer du poumon. L’approche comparative des tumeurs pulmonaires permet d’affiner les classifications avec l’identification de sous-types inédits. Par l’étude dynamique, nous avons montré que le réseau est efficace pour mettre en évidence des modules de noeuds majeurs, leur lien avec les voies de signalisation et leur implication dans le caractère transformant de METex14Del.

Résumé traduit

Lung cancer management largely depends on classification into histological and molecular subtypes, defined by the presence or absence of actionable molecular alterations. Among the numerous genetic aberrations identified, mutations in the MET receptor that cause exon 14 skipping (METex14Del) are found in approximately 3% of patients and represent a new therapeutic target. However, the oncogenic mechanisms driven by METex14Del remain poorly understood, and responses to targeted therapies are still suboptimal. Meanwhile, the growing number of large-scale sequencing projects has generated substantial “omics” datasets, publicly accessible in various databases. These datasets enable computational biology approaches to achieve more refined classifications based on the gene expression profiles of lung tumors. Nevertheless, the diversity of sequencing technologies makes direct comparison or data merging challenging, preventing a unified classification built from large-scale datasets.Using systems biology methods—particularly gene regulatory network (GRN) inference applied to lung cancer—it becomes possible to integrate vast transcriptomic datasets. Analyzing these networks facilitates the identification of key regulators, to which a regulatory activity metric (called influence) can be assigned. In this context, we developed the lung.cRegMap web platform, which incorporates expression profiles from lung cancer cell lines and multiple patient cohorts, totaling 5,487 samples. Through this approach, we established seven distinct subgroups of lung cancer, onto which we mapped clinical, molecular, and histological data. The resulting classification is consistent with histology yet also reveals a subgroup of adenocarcinomas with particularly poor prognosis, as well as new subtypes distinguished by mesenchymal and neuroendocrine gene expression signatures. Each group is characterized by a specific set of key regulators whose importance can be estimated via gene dependency assays in cell models. Combining GRN analysis with the notion of regulator influence enables dynamic exploration of regulatory networks. We capitalized on this characteristic to investigate the dynamic response to HGF in cells harboring METex14Del. This study uncovered the activation of a major regulatory node composed of several interconnected transcription factors (ETS1, FOSL1, SMAD3), all regulated by the RAS-ERK signaling pathway. Experimental validations confirmed the involvement of these transcription factors in controlling the expression of genes induced by METex14Del, and underscored the central role of the RAS-ERK pathway in cell migration and invasion. This pathway thus constitutes a promising therapeutic target, particularly when responses to MET inhibitors are incomplete.Overall, our findings validate the relevance and robustness of this gene regulatory network model for lung cancer. By comparing different lung tumor datasets, we refined classifications to reveal previously unrecognized subtypes. Through dynamic analyses, we demonstrated that the network effectively highlights major regulatory modules, their links to signaling pathways, and their involvement in the oncogenic properties of METex14Del.

  • Directeur(s) de thèse : Elati, Mohamed - Tulasne, David
  • Président de jury : Copin, Marie-Christine
  • Membre(s) de jury : Calzone, Laurence
  • Rapporteur(s) : Lecellier, Charles-Henri - Grumolato, Luca
  • Laboratoire : Hétérogénéité, plasticité et résistance aux thérapies des cancers (CANTHER)
  • École doctorale : École doctorale Biologie-Santé

AUTEUR

  • Pawlak, Geoffrey
Droits d'auteur : Ce document est protégé en vertu du Code de la Propriété Intellectuelle.
Accès réservé à l'ensemble de la communauté universitaire jusqu'au 30/09/2026