Large-scale genomic investigation into factors contributing to metabolic derangements and their comorbidity
Etude génomique à grande échelle des facteurs conduisant à des dérangements métaboliques et leur comorbidité
- Génomique
- Dérangements métaboliques
- Biostatistique
- Score polygénique
- Randomisation mendélienne
- Diabète
- Troubles du métabolisme
- Diabètes
- Hypertension artérielle
- Comorbidité
- Hypercholestérolémie familiale
- Lipoprotéine A
- Génomique
- Prédisposition (médecine)
- Scores en médecine
- Biométrie
- Maladies métaboliques
- Diabète
- Hypertension artérielle
- Comorbidité
- Hypercholestérolémie
- Lipoprotéine (a)
- Prédisposition génétique à une maladie
- Génomique
- Biostatistiques
- Genomic
- Metabolic derangements
- Biostatistic
- Polygenic risk score
- Mendelian randomization
- Diabète
- Langue : Anglais
- Discipline : Sciences de la vie et de la santé
- Identifiant : 2024ULILS034
- Type de thèse : Doctorat
- Date de soutenance : 13/11/2024
Résumé en langue originale
Les comorbidités, co-occurrences de plusieurs maladies chez un seul individu, représentent un défi pour les systèmes de santé : les patients avec plusieurs maladies atteignent difficilement leurs objectifs de traitement et sont à risques d’autres complications. La médecine de précision, qui exploite l’ensemble des données disponibles pour adapter le traitement aux profils individuels des patients, constitue une approche prometteuse pour relever ce défi. Une des informations qu’il est possible d’extraire pour appliquer la médecine de précision est la donnée génétique. En effet, les mutations génétiques germinales ont le même effet tout au long de la vie d’un individu, fournissant ainsi une base cohérente pour comprendre le développement de la maladie, sa progression, et la réponse au traitement. Les avancées récentes en génétique et en statistique ont permis le développement d’études multiomiques à grande échelle. Ces données ont permis aux chercheurs de mener des investigations génomiques approfondies, révélant des informations précieuses sur l’architecture génétique de maladies complexes telles que le diabète de type 2 et l’hypertension. Dans cette thèse, j’ai exploité des ensembles de données multiomiques à grande échelle pour aborder plusieurs questions non résolues liées aux comorbidités métaboliques. Mes recherches se sont concentrées sur trois projets principaux. Le premier fut le développement d’un package R, comorbidPGS, conçu pour évaluer la prédiction réciproque du risque génétique entre phénotypes à l’aide de scores polygéniques, un outil précieux en génétique statistique permettant d’estimer la prédisposition génétique d’une condition. Cet outil facilite l’exploration de la prédisposition génétique aux maladies comorbides. Le deuxième projet utilise comorbidPGS pour explorer l’architecture génétique sous-jacente à la comorbidité entre le diabète et l’hypertension artérielle. Bien que les génétiques du diabète et de l’hypertension aient été largement étudiées séparément, leur base génétique commune est encore mal comprise. En regroupant les variants génétiques associés au diabète de type 2 et/ou à l’hypertension artérielle, j’ai exploré les mécanismes sous-jacents qui contribuent à leur comorbidité. Le troisième projet de recherche se concentre sur l’effet des niveaux élevés de lipoprotéine(a) sur l’hypercholestérolémie familiale, une maladie héréditaire caractérisée par des niveaux élevés de cholestérol des lipoprotéines de basse densité. La lipoprotéine(a) et l’hypercholestérolémie sont tous deux associés à des comorbidités cardiovasculaires. Les patients atteints d’hypercholestérolémie familiale présentent souvent des niveaux de lipoprotéine(a) élevés. De plus, le cholestérol associé à la lipoprotéine(a) peut être mal classé en cholestérol des lipoprotéines de basse densité, entraînant des erreurs dans le diagnostic de l’hypercholestérolémie familiale. En utilisant le plus grand ensemble de données de séquençage d’exome complet de la UK Biobank, j’ai examiné l’influence des niveaux de lipoprotéine(a) sur le diagnostic de l’hypercholestérolémie familiale, et évalué les contributions polygéniques et monogéniques sur l’hypercholestérolémie générale. Ce travail a permis de souligner l’importance d’intégrer plusieurs couches de preuves omiques pour démêler les interactions complexes entre les mécanismes biologiques corrélés, associés et/ou causaux. Il met également en évidence la valeur des scores polygéniques dans la prédiction des risques de complications au cours de la vie, même pour des maladies liées au vieillissement telles que le diabète ou l’hypertension. Faisant progresser la compréhension des relations génétiques entre les maladies complexes, cette thèse permet d’imaginer des diagnostics plus précis, des interventions thérapeutiques ciblées, contribuant ainsi à se rapprocher du paradigme de la médecine de précision.
Résumé traduit
Comorbidity, or the co-occurrence of multiple conditions in an individual, represents a significant challenge to healthcare systems globally: individuals with co-occurring conditions often fail to reach their treatment objective, thus increasing their risk of additional complications. Precision medicine, harnessing all available data to tailor treatment to individual patient profiles, is a promising approach to address this challenge. A key component of precision medicine is the integration of individual genetic information. Since germline genetic variants or mutations are constant throughout an individual’s life course, they have the same effect throughout an individual’s disease trajectory, providing a consistent foundation for understanding disease development, progression, and treatment response.Recent advancements in both genetics technology and statistical methodologies facilitated the development of large-scale multiomics studies. These extensive datasets enabled researchers to perform significant genomic investigations, revealing insights into the genetic architecture of complex diseases such as type 2 diabetes (T2D) and hypertension. However, the sheer volume of data also introduces the risk of spurious associations, if it is not carefully integrated within a triangulation of evidence framework.In my thesis, I leveraged large-scale multiomics datasets to address several unresolved questions related to metabolic comorbidity. My research focussed on three key research projects. The first project was the development of an R-based software tool, comorbidPGS, designed to assess the genetic reciprocal risk prediction between phenotypes using polygenic scores (PGS), a valuable tool in statistical genetics allowing to estimate the genetic liability to one trait. This tool facilitates the exploration of genetic predisposition to comorbid conditions.The second project uses comorbidPGS to investigate the genetic architecture underlying the comorbidity between T2D and high blood pressure (BP). Although the genetics of T2D and BP have been extensively studied independently, their shared genetic underpinnings are not well understood. By clustering single nucleotide variants associated with T2D and/or high BP, I identified and dissected the underlying mechanisms that contribute to the T2D-BP comorbidity.The third research project targeted the effect of high lipoprotein(a) (Lp(a)) levels on familial hypercholesterolaemia (FH), a heritable condition characterised by elevated levels of low-density lipoprotein cholesterol (LDL-C). Both Lp(a) and FH are independently associated with cardiovascular comorbidities. FH patients often exhibit high Lp(a) levels compared to the general population. Additionally, Lp(a)-associated cholesterol (Lp(a)-C) can be misclassified as LDL-C, leading to potential inaccuracies in FH diagnosis. Leveraging the largest whole-exome sequencing dataset from the UK Biobank, I examined the impact of Lp(a) levels on FH diagnosis and evaluated the overall polygenic and monogenic contributions to high LDL-C levels.This work highlights the value of integrating multiple layers of omics evidence to disentangle the intricate interplay between correlated, associated, and causal biological mechanisms. It also emphasizes the power of PGS in predicting lifelong risk for complications, even for age-related diseases such as T2D and hypertension. Advancing the understanding of genetic relationships between complex conditions, this thesis paves the way for more accurate diagnoses and targeted therapeutic interventions, thereby contributing to the realisation of the precision medicine paradigm.
- Directeur(s) de thèse : Prokopenko, Inga - Froguel, Philippe
- Président de jury : Bouatia Naji, Nabila
- Membre(s) de jury : Morris, Andrew
- Rapporteur(s) : Bouatia Naji, Nabila - Udler, Miriam
- Laboratoire : Génomique intégrative et modélisation des maladies métaboliques (Lille)
- École doctorale : École graduée Biologie-Santé (Lille ; 2000-....)
AUTEUR
- Pascat, Vincent