Titre original :

Modélisation et requêtes des documents semi-structurés : exploitation de la structure de graphe

  • Langue : Français
  • Discipline : Informatique
  • Identifiant : Inconnu
  • Type de thèse : Doctorat
  • Date de soutenance : 01/01/2005

Résumé en langue originale

La notion de données semi-structurées est liée au monde Web. On appelle donnée semi-structurée une donnée dont le schéma n'est pas défini a priori. Il peut s'agir d'une page HTML ou d'un site Web tout entier ou encore d'un document XML. Cette thèse étudient les requêtes sur les données semi-structurées modélisées par des graphes. On s'intéresse à différentes représentations des données semi-structurées par des graphes et on considère différents langages de requêtes associés. Un problème différent est étudié pour chaque couple (représentation, langage). Dans le cas des graphes orientés, on utilise des techniques de réécriture et d'automates pour étudier - à des fins d'optimisation de requêtes - les contraintes d'inclusions. Ces contraintes portent sur les chemins qui permettent de naviguer dans la donnée. Pour exploiter l'information liée à la structure d'une donnée, on génère un index qui préserve les contraintes d'inclusions. On étend cette étude pour obtenir le concept de requête graphe. Son intérêt est de permettre la composition de requêtes et de définir celle-ci graphiquement Appliquées au cas des documents "XMLcoloré ", les requêtes graphes permettent d'étudier formellement l'expressivité et la complexité de langages de requêtes inspirés de XPath et de XQuery. Les résultats théoriques sont validés par des expérimentations.

  • Directeur(s) de thèse : Tison, Sophie - Caron, Anne-Cécile

AUTEUR

  • Debarbieux, Denis
Droits d'auteur : Ce document est protégé en vertu du Code de la Propriété Intellectuelle.
Accès libre