Titre original :

Algorithmes de prédiction et de recherche de multi-structures d'ARN

Titre traduit :

Prediction and pattern matching algorithms for RNA multi-structures

Mots-clés en français :
  • Algorithmique discrète

  • Bioinformatique
  • ARN non codants
  • ARN
  • Génome
  • Langue : Anglais
  • Discipline : Informatique
  • Identifiant : 2011LIL10096
  • Type de thèse : Doctorat
  • Date de soutenance : 16/11/2011

Résumé en langue originale

L'ARN (acide ribonucléique) est une molécule ubiquitaire qui joueplusieurs rôles fondamentaux au sein de la cellule: synthèse desprotéines avec les ARN messagers, activité catalytique ou implicationdans la régulation, les ARN non-codants. Les nouvelles technologies deséquençage à haut- débit permettent de produire des milliards de séquences à moindre coût, posant de manière cruciale la question de l'analyse de ces données.L'objectif de cette thèse est de définir de nouvelles méthodescomputationnelles pour aider à l'analyse de ces séquences dans le casdes ARN non-codants. Dans cette perspective, la "structuresecondaire" d'un ARN, formée par l'ensemble des appariements entrebases, délivre des informations utiles pour étudier la fonction del'ARN. Notre travail se concentre plus particulièrement surl'ensemble des structures potentielles que peut adopter une séquenced'ARN donnée, ensemble que nous appelons "multi-structure". Nousapportons deux contributions: un algorithme pour générersystématiquement toutes les structures localement optimales composantune multi-structure, et un algorithme basé sur la recherche d'unemulti-structure pour identifier un ARN non-codant dans une séquencegénomique. Ces résultats ont été mis en oeuvre dans deux logiciels,Alterna et Regliss, appliqués avec succès à des ensembles de test.

Résumé traduit

RNA (ribonucleic acid) molecules have various functions in cells. Justas they can store and deliver the DNA message for the proteinsynthesis (messenger RNAs), they can also directly catalyze chemicalreactions or act as a regulator (functional RNAs, also callednon-coding RNAs). Nowadays, recent sequencing technologies yield billions of genomic sequences - DNA, RNA - at a very small cost. However, sequencing isonly the first step: The function of the sequence remains open forinvestigation. The objective of the thesis is to define newcomputational methods to help sequence and structure analysis ofnon-coding RNAs. In this perspective, the "secondary structure" of an RNA,made with base pairs, provides useful hints to further study itsfunction. Our work is focused on sets of all possible RNA structuresfor a given sequence, introducing the concept of "RNAmulti-structures". The thesis details how such sets can be constructed systematically to generate all locally optimal secondary structures, and how they can be used as a pattern to identify non-coding RNAs in genomic sequences.We provide efficient algorithms for these two problems. Thesealgorithms have been implementated in the software tools Alterna andRegliss and tested on real data, providing new insight into RNAstructures.

  • Directeur(s) de thèse : Touzet, Hélène - Giraud, Mathieu
  • École doctorale : École doctorale Sciences pour l'ingénieur (Lille)

AUTEUR

  • Saffarian, Azadeh
Droits d'auteur : Ce document est protégé en vertu du Code de la Propriété Intellectuelle.
Accès libre