Analyse des données spatiales : applications à la santé des populations
Spatial data analysis : applications to population health
- Analyse de données fonctionnelles
- Bases de données spatio-temporelles
- Statistique démographique
- Statistique semi-paramétrique
- Mortalité
- Suicide
- Autocorrélation (statistique)
- Fonctionnelles statistiques
- Spatial statistics
- Demography
- Functional data analysis
- Non-parametric statistics
- Suicide relapses
- Langue : Anglais
- Discipline : Mathématiques et leurs interactions
- Identifiant : 2021LILUB021
- Type de thèse : Doctorat
- Date de soutenance : 03/12/2021
Résumé en langue originale
Ces dernières années, les études sur la démographie se sont considérablement développées. L'un des objectifs principaux de ces études est d'analyser et de prévoir statistiquement les taux de mortalité et de fécondité sans se fier aux opinions subjectives des experts. Par conséquent, pour identifier les caractéristiques de la dynamique de mortalité d'une population, de nombreux modèles ont été développés depuis l'introduction du célèbre modèle proposé par Lee et Carter (1992). De nombreuses recherches disponibles dans la littérature tendent à se concentrer sur la perspective des séries temporelles de la prévision des taux de mortalité. Le manque d'études dans le cadre spatial a suscité notre intérêt pour l'étude des taux de mortalité dans des localités voisines. L'extension du modèle de Lee-Carter (1992) en incorporant l'idée de l'analyse des données fonctionnelles (FDA) a inspiré la première partie de cette thèse où le concept de FDA a été appliqué au cadre d'analyse démographique spatiale. Nous étudions l'existence d'une autocorrélation spatiale pour des données de mortalité des pays voisins. Une méthode fonctionnelle spatiale basée sur les composantes principales est proposée pour révéler une certaine dépendance spatiale en considérant directement l'information spatiale. Une statistique fonctionnelle de Moran est introduite. Cette statistique aide à déterminer l'autocorrélation spatiale dans les données fonctionnelles par la mise en œuvre de l'ACP spatio-fonctionnelle. Cette statistique fonctionnelle de Moran est à notre connaissance la première de son genre dans le cadre des données fonctionnelles.La deuxième partie de cette thèse étudie l'impact du système VigilanS (programme de prévention des tentatives de suicide en France) sur la récidive suicidaire où les données de ce système (âge, sexe, adresse, historique des tentatives de suicide, séjour à l'hôpital etc.) concernent la région Nord-Pas-de-Calais tout en construisant des modèles de prédiction spatiale. Les risques de tentatives de suicide sont étudiés à l'aide de modèles probit spatiaux. Nous proposons un modèle probit partiellement linéaire pour des données spatialement dépendantes. Ce modèle n'a pas été étudié dans la littérature d'un point de vue théorique et cette contribution comble cette lacune en abordant un modèle d'erreur autorégressive spatiale (SAE) où la structure de dépendance spatiale est intégrée dans un terme de perturbation du modèle étudié. Une méthode d'estimation semi-paramétrique est obtenue en combinant l'approche de la méthode des moments généralisée et la méthode de vraisemblance pondérée. Nous avons examiné l'utilisation de ce modèle de régression probit spatial ainsi que d'autres modèles existants dans la littérature pour étudier les récidives de tentatives suicidaires des patients impliqués dans le système VigilanS. Cette thèse met en évidence l'importance de la statistique spatiale dans l'analyse des problèmes démographiques et de suicide. Il est également intéressant de voir comment les données fonctionnelles peuvent être utilisées comme un outil dans le domaine de la démographie, notamment pour capturer une autocorrélation spatiale dans les taux de mortalité lorsque l'espace est concerné. En outre, l'utilisation de modèles de régression spatiale pour étudier les récidives de tentatives de suicide, met en évidence l'impact de voisinage sur l’acte suicidaire.
Résumé traduit
In recent years, the studies of demographic forecasts have grown significantly. One of the goals of demography is to statistically analyze and predict mortality and fertility rates without relying on subjective opinions of experts. Therefore, to identify the characteristics of the mortality dynamics of a population, many models were developed since the introduction of the famous model proposed by Lee and Carter (1992). Many research available in the literature tend to focus on the time series perspective of forecasting mortality rates. Lack of studies from the spatial framework sparked our interest in investigating the mortality rates from the spatial framework. The extension of the Lee-Carter (1992) model by incorporating the idea of functional data analysis (FDA) inspired the first part of this thesis where the FDA concept was applied to the spatial demographic analysis framework.We investigate the existence of spatial autocorrelation in mortality data of neighbouring countries. A functional spatial principal component method is proposed to reveal spatial patterns by directly considering spatial information. A functional Moran’s I statistic is introduced. This statistic aids in determining the spatial autocorrelation in functional data through the implementation of the spatio-functional PCA. This functional Moran’s I statistic is the first of its kind in the functional data framework.The second part of this thesis investigates the impact of the VigilanS system (program to prevent suicide reattempts in France) on suicide recidivism where the data from this system (patient’s age, sex, address, history of suicide attempts, hospital stay etc.) are mapped on the map of the Nord-Pas-de-Calais region while constructing spatial prediction models. The risks of suicide attempts are mapped with the help of spatial probit models. We propose a partially linear probit model for spatially dependent data. This model has not been investigated in the literature from a theoretical point of view and this part fills that gap by addressing a spatial autoregressive error (SAE) model where the spatial dependence structure is integrated in a disturbance term of the studied model. A semi-parametric estimation method is obtained by combining the generalized method of moments approach and the weighted likelihood method. We examined the use of this spatial probit regression model as well as other existing models in the literature to study the suicide relapses of patients involved in the VigilanS system. This thesis highlights the importance of spatial statistics in analyzing demographic and suicide problems. It is also interesting to see how functional data can be used as a tool in the field of demography especially in capturing spatial autocorrelation in mortality rates where space is of concern. Furthermore, the use of spatial regression models to study suicidal relapses sheds light on the impact of neighbouring locations on suicide cases.
- Directeur(s) de thèse : Dabo-Niang, Sophie
- Président de jury : Dermoune, Azzouz
- Membre(s) de jury : Pathmanathan, Dharini - Ullah, Shahid - Bin Mohamed, Ibrahim - Amad, Ali - Wathelet, Marielle - Salloum, Zaynab
- Rapporteur(s) : Menezes, Raquel - Slaoui, Yousri
- Laboratoire : Laboratoire Paul Painlevé
- École doctorale : École graduée Mathématiques, sciences du numérique et de leurs interactions (Lille ; 2021-....)
AUTEUR
- Ali Hassan, Alaa