Titre original :

Modélisation de la stéatose hépatique (NAFLD) et de ses facteurs de risque par apprentissage sur des données de santé

Titre traduit :

Modelling of hepatic steatosis (NAFLD) and its risk factors by learning from health data

Mots-clés en français :
  • Modèle de Markov
  • PMSI
  • NASH
  • Surpoids. obésité et diabète de type 2
  • Cirrhose
  • Carcinome hépatocellulaire

  • Stéatose hépatique non alcoolique
  • Stéatose hépatique non alcoolique
  • Surpoids
  • Obésité
  • Diabète non-insulinodépendant
  • Cirrhose hépatique
  • Carcinome hépatocellulaire
  • Markov, Processus de
  • Programme de médicalisation des systèmes d'information
  • Stéatose hépatique non alcoolique
  • Facteurs de risque
  • Surpoids
  • Obésité
  • Diabète de type 2
  • Cirrhose du foie
  • Tumeurs du foie
  • Carcinome hépatocellulaire
  • Modèles théoriques
Mots-clés en anglais :
  • Markov model
  • PMSI
  • NASH
  • Overweight. obesity and type 2 diabetes
  • Cirrhosis
  • Hepatocellular carcinoma

  • Langue : Français
  • Discipline : Santé publique, environnement et société
  • Identifiant : 2020LILUS028
  • Type de thèse : Doctorat
  • Date de soutenance : 10/12/2020

Résumé en langue originale

La stéatose hépatique non-alcoolique (NAFLD) est une maladie chronique du foie regroupant la stéatose simple à évolution lente, et la stéatohépatite non-alcoolique (NASH), forme inflammatoire accélérant son évolution. On estime qu’une personne sur quatre dans le monde est atteinte de NAFLD, et cette prévalence augmente rapidement, en parallèle avec celle de ses principaux facteurs de risque : le surpoids, l’obésité et le diabète. Cette pathologie est asymptomatique jusqu’aux complications, la cirrhose et le cancer du foie (carcinome hépatocellulaire, CHC), ce qui induit un diagnostic tardif et un impact négatif sur la morbidité et mortalité associées. De plus, le diagnostic de référence nécessite une biopsie hépatique, un examen invasif qui ne peut être réalisé en routine. En conséquence, la progression de la maladie est mal connue et son estimation peut souffrir d’un biais de sélection, vers les patients présentant des facteurs de risques importants, qui nécessitaient une biopsie en premier lieu. Mieux l’appréhender permettrait de mettre en place des stratégies diminuant son fardeau.L’approche par modélisation est appropriée pour prendre en compte l’ensemble des patients susceptibles, sans avoir à réaliser d’étude de suivi à large échelle par biopsie hépatique chez des patients en majorité asymptomatiques. Les objectifs de cette thèse sont de décrire et quantifier la progression de la NAFLD, de prédire la morbidité et mortalité associées, ainsi que d’identifier la population à risque, par modèles de Markov. Pour cela, il est nécessaire de renseigner une partie des paramètres de progression via une revue de la littérature, de caractériser les états initiaux (population susceptible de développer la NAFLD) et les états finaux (mortalité due à la NAFLD), pour en déduire les paramètres de progression manquants entre l’entrée dans la maladie et la mortalité, par rétro-calcul.Pour caractériser la mortalité due à la NAFLD de manière exhaustive, nous avons identifié tous les patients avec une cirrhose ou un CHC à partir des bases de données nationales des hôpitaux, soit plus de 380 000 patients. Nous avons ensuite élaboré un algorithme d’identification pour déterminer l’étiologie sous-jacente à la complication hépatique, à partir de l’ensemble des séjours des patients identifiés. Cet algorithme nécessite d’identifier les patients avec cirrhose ou CHC d’origine alcoolique ou virale, pour obtenir par élimination uniquement les patients NAFLD.Une fois les données de mortalité spécifiques obtenues, nous avons estimé la population susceptible de développer la NAFLD, définie comme l’ensemble des individus avec un surpoids ou un diabète de type 2, en excluant la population de buveurs excessifs. Nous avons estimé la prévalence et l’incidence de cette population, et modélisé son évolution avec l’âge et les années, à partir de données individuelles d’enquêtes représentatives de la population française.Enfin, nous avons quantifié la progression de la NAFLD, et l’impact des facteurs de risque, via deux approches : à partir de la littérature, et à partir de données de biopsies de plus de 1 800 patients obèses candidats à la chirurgie bariatrique, aboutissant à un outil de prédiction de la progression de la NAFLD dans cette population. Nous avons choisi de rétro-calculer les paramètres de progression correspondant aux états asymptomatiques, les plus susceptibles au biais de sélection.Nous avons obtenu un modèle de l’évolution de la NAFLD, prenant en compte la distribution dynamique de la population parmi les classes de poids et le statut de diabète, et aboutissant aux statistiques observées de décès dus à la NAFLD. Le modèle prend en compte le sexe, l’âge, l’année, la classe d’IMC, le statut de diabète et la présence d’un polymorphisme génétique (PNPLA3 rs738409, C→G) comme covariables de progression. Il constitue un outil permettant d’évaluer l’impact d’un éventuel traitement ou d’une politique de santé publique sur la morbi-mortalité.

Résumé traduit

Non-alcoholic fatty liver disease (NAFLD) is a chronic liver disease which is a combination of simple, slowly progressing steatosis, and non-alcoholic steatohepatitis (NASH), an inflammatory form which accelerates its progression. It is estimated that one in four people in the world is affected by NAFLD, and its prevalence is increasing rapidly, in parallel with the prevalence of its main risk factors: overweight, obesity and type 2 diabetes.This pathology is asymptomatic up to the complications, cirrhosis and liver cancer (hepatocellular carcinoma, HCC), which leads to late diagnosis and a negative impact on the associated morbidity and mortality. Furthermore, the reference diagnosis requires a liver biopsy, an invasive examination that cannot be performed routinely. As a result, the progression of the disease is poorly known and its estimation may suffer from a selection bias, towards patients with significant risk factors, who require a biopsy in the first place. A better understanding would allow the implementation of strategies to reduce its burden.The modelling approach is appropriate to take into account all susceptible patients, without having to carry out a large-scale follow-up study using liver biopsies in patients who are mostly asymptomatic. The objectives of this thesis are to describe and quantify the progression of NAFLD, to predict the associated morbidity and mortality, and to identify the population at risk, using Markov models. To do this, it is necessary to fill in some of the progression parameters via a literature review, to characterise the initial states (population likely to develop NAFLD) and the final states (mortality due to NAFLD), in order to deduce the missing progression parameters between the onset of the disease and mortality, by back-calculation.To exhaustively characterise NAFLD mortality, we identified all patients with cirrhosis or HCC from national hospital databases, representing more than 380,000 patients. We then developed an identification algorithm to determine the etiology underlying the hepatic complication, based on all the stays of the identified patients. This algorithm requires the identification of patients with cirrhosis or HCC of alcoholic or viral origin, to obtain by elimination only NAFLD patients. Once the specific mortality data had been obtained, we estimated the population likely to develop NAFLD, defined as all individuals with overweight or type 2 diabetes, excluding the population of excessive drinkers. We estimated the prevalence and incidence of this population, and modelled its evolution with age and years, based on individual data from surveys representative of the French population.Finally, we quantified the progression of NAFLD, and the impact of risk factors, using two approaches: from the literature, and from biopsy data from more than 1,800 obese patients who were candidates for bariatric surgery, resulting in a tool for predicting the progression of NAFLD in this population. We chose to back-calculate the progression parameters corresponding to the asymptomatic states, which are the most susceptible to selection bias.We obtained a model of the progression of NAFLD, taking into account the dynamic distribution of the population among weight classes and diabetes status, and resulting in the observed statistics of NAFLD deaths. The model takes into account gender, age, year, BMI (body mass index) class, diabetes status and the presence of a genetic polymorphism (PNPLA3 rs738409, C→G) as covariates of progression. It is a tool for assessing the impact of a possible treatment or public health policy on morbidity and mortality.

  • Directeur(s) de thèse : Mathurin, Philippe - Deuffic-Burban, Sylvie
  • Membre(s) de jury : Deuffic-Burban, Sylvie
  • Laboratoire : Institute for Translational Research in Inflammation - U 1286 / INFINITE (Ex-Liric)
  • École doctorale : École doctorale Biologie-Santé (Lille)

AUTEUR

  • Bauvin, Pierre
Droits d'auteur : Ce document est protégé en vertu du Code de la Propriété Intellectuelle.
Accès libre