Titre original :

Outils de décision pour l'accès à l'information audio : méthodes de Monte Carlo et méthodes à noyaux

  • Langue : Français
  • Discipline : Sciences physiques. Automatique
  • Identifiant : Inconnu
  • Type de mémoire : Habilitation à diriger des recherches
  • Date de soutenance : 01/01/2006

Résumé en langue originale

L'Internet a créé de nouvelles possibilités d'accès à l'information, notamment par les bibliothèques numériques, le commerce ou l'éducation personnalisée. La force de l'Internet tient à sa nature distribuée, qui permet à chaque individu de contribuer localement et à sa façon à la mise à disposition d'informations. Mais cette nature distribuée est aussi une faiblesse, car il n'y a pas d'organisation des données. Aussi, l'accès à des informations précises est-il rendu très difficile par l'ampleur de la base de données et l'indexation automatique de leur contenu est devenue une tàche maintenant essentielle. Parmi toutes les données disponibles (Internet ou autres), je me suis intéressé aux informations audio, qui nécessitent des techniques d'indexation spécifiques, en particulier pour la musique, la parole et l'environnement sonore urbain. Les méthodes présentées dans ce manuscrit sont dédiées à la segmentation de signaux, à leur classification, à leur représentation, à leur modélisation, et à l'estimation de paramètres. Elles ont été développées de manière "générique ", c'est-à-dire adaptables à des problématiques non-audio. Les travaux exposés se répartissent en deux grands axes méthodologiques tout d'abord, des approches bayésiennes, faisant appel à une modélisation explicite des données ainsi qu'à des algorithmes d'estimation stochastiques (méthodes MCMC et filtres particulaires). Par exemple, des modèles de dimension variable et les algorithmes " à sauts" necessaires à leur utilisation ont été développés. Ensuite, des méthodes d'apprentissage " à noyaux" permettant de décrire les données en termes fonctionnels, conduisant à des algorithmes de détection, classification et estimation de type SVM. En particulier, nous avons proposé une famille d'algorithmes de détection de ruptures applicables à des données de très grandes dimension (plusieurs milliers). Les applications traitées comprennent la transcription automatique de la musique, la segmentation de locuteurs, la détection d'effets sonores dans l'environnement urbain, la détection de défàuts de capteurs pour la localisation de véhicule terrestre ou encore la classification de défauts d'enceintes acoustiques

  • Directeur(s) de thèse : Vanheeghe, Philippe

AUTEUR

  • Davy, Manuel
Droits d'auteur : Ce document est protégé en vertu du Code de la Propriété Intellectuelle.
Accès libre