Titre original :

Identifying structure in online and collaborative learning problems

Titre traduit :

Identifier la structure des problèmes d’apprentissage en ligne et collaboratif

Mots-clés en français :
  • Apprentissage automatique en ligne
  • Bandit manchot (mathématiques)
  • Réseaux de graphes
  • Apprentissage automatique collaboratif
  • Estimation moyenne

  • Apprentissage par renforcement (intelligence artificielle)
  • Réseaux d'ordinateurs
Mots-clés en anglais :
  • Decentralized learning
  • Collaborative Learning
  • Reinforcement Learning
  • Bandits
  • Online Learning
  • Graph

  • Langue : Anglais
  • Discipline : Informatique et applications
  • Identifiant : 2022ULILB031
  • Type de thèse : Doctorat
  • Date de soutenance : 25/11/2022

Résumé en langue originale

De nos jours, il est courant de traiter des problèmes à grande échelle et si nous prenons en compte la structure du problème, cela pourrait nous aider à améliorer les performances d'apprentissage. Dans ce travail, nous avons proposé des approches qui tiennent compte de la structure dans deux contextes: (i) les problèmes d'apprentissage par renforcement basés sur des modèles où nous avons réduit le regret (ii) les problèmes d'estimation de moyenne personnalisée en ligne où nous avons réduit la complexité de l'échantillon pour l'estimation moyenne.

Résumé traduit

Nowadays it is commonplace to deal with large scale problems and should we take problem structure into account, it could assist us toward improving learning performance. In this work, we have proposed approaches that take into account the structure in two settings: (i) model-based reinforcement learning problems where we have reduced the regret (ii) online personalized mean estimation problems where we have reduced the sample complexity for mean estimation.

  • Directeur(s) de thèse : Tommasi, Marc - Bellet, Aurélien
  • Président de jury : Jourdan, Laetitia
  • Membre(s) de jury : Pike-Burke, Ciara - Maillard, Odalric-Ambrym
  • Rapporteur(s) : Kadri, Hachem - Geist, Matthieu
  • Laboratoire : Centre de Recherche en Informatique, Signal et Automatique de Lille - Centre Inria de l'Université de Lille
  • École doctorale : Ecole doctorale Mathématiques, sciences du numérique et de leurs interactions (Lille)

AUTEUR

  • Asadi, Mahsa
Droits d'auteur : Ce document est protégé en vertu du Code de la Propriété Intellectuelle.
Accès libre