Titre original :

Modélisation probabiliste et inférence statistique pour l’analyse des données spatialisées

Mots-clés en français :
  • Données spatialisées

  • Processus ponctuels
  • Markov, Processus de
  • Estimation de paramètres
  • Monte-Carlo, Méthode de
  • Algorithmes EM
  • Géométrie stochastique
  • Analyse des données
  • Langue : Français
  • Discipline : Mathématiques
  • Identifiant : Inconnu
  • Type de mémoire : Habilitation à diriger des recherches
  • Date de soutenance : 22/10/2014

Résumé en langue originale

Nous appelons données spatialisées un ensemble dont chaque élément comporte deux composantes~: une position et une caractéristique. Les images numériques sont un exemple de données spatialisées~: le pixel est caractérisé par un index dans une matrice et sa valeur numérique indique la couleur associée à cette position dans l'image. Les catalogues des galaxies en astronomie, les bases de données recensant des élevages laitiers sont également des exemples des données spatialisées. Un catalogue de galaxies contient la position dans notre univers et les caractéristiques (masse, luminosité, déplacement vers le rouge, forme, etc.) de chaque galaxie. Une base de données recensant des élevages laitiers contient la position dans le territoire et les caractéristiques de chaque ferme (espèce et nombre d'animaux, filiation et lieu de naissance de chaque animal, etc.). Dans ces derniers exemples, les positions des éléments ne sont plus disposées sur une grille régulière, et les caractéristiques correspondantes se présentent sous la forme de structures de données très riches et très complexes. Le caractère spatialisé des données implique que les réponses possibles aux questions que les données suggèrent, comportent une forte composante morphologique. Quelques exemples de questions : extraire les réseaux routiers présents dans une image satellitaire, caractériser la répartition spatiale à large échelle des galaxies de notre Univers, déterminer la tendance à l'agrégation des fermes ayant une grande prédisposition pour une certaine maladie. En effet, dans de nombreuses situations, pouvoir analyser des données spatialisées revient à être capable de répondre à la question suivante : quelle est la forme qui se trouve "cachée" dans les données ? Notre objectif est d'étudier et proposer des outils probabilistes et statistiques permettant de répondre à cette question. Plus précisément, nous nous sommes focalisés sur le développement des outils suivants : - modélisation stochastique: qu'est-ce que la forme que l'on cherche ? - simulation de type MCMC: comment mettre en oeuvre la forme ? - inférence statistique et évaluation : comment détecter la forme, quels sont les paramètres de la forme, la forme trouvée existe-t-elle vraiment ? Le mémoire est organisé en quatre parties. Les trois premières parties correspondent chacune à une de ces questions. Chaque partie contient deux chapitres. Le premier chapitre introduit les outils mathématiques utilisés. Le deuxième chapitre présente nos contributions comme réponses à la question du projet. La quatrième et dernière partie du mémoire est dédiée aux conclusions et aux perspectives.

  • Directeur(s) de thèse : Davydov, Youri
  • Laboratoire : Laboratoire Paul Painlevé
  • École doctorale :

AUTEUR

  • Stoica, Radu S.
Droits d'auteur : Ce document est protégé en vertu du Code de la Propriété Intellectuelle.
Accès réservé aux membres de l'Université de Lille sur authentification