Pépite | Identifier la structure des problèmes d’apprentissage en ligne et collaboratif

Imprimer Version XML Ajouter à mon panier

Titre original :

Identifying structure in online and collaborative learning problems

Titre traduit :

Identifier la structure des problèmes d’apprentissage en ligne et collaboratif

Mots-clés en français :

Apprentissage automatique en ligne
Bandit manchot (mathématiques)
Réseaux de graphes
Apprentissage automatique collaboratif
Estimation moyenne

Apprentissage par renforcement (intelligence artificielle)
Réseaux d'ordinateurs

Mots-clés en anglais :

Decentralized learning
Collaborative Learning
Reinforcement Learning
Bandits
Online Learning
Graph

Informations générales

Langue : Anglais
Discipline : Informatique et applications
Identifiant : 2022ULILB031
Type de thèse : Doctorat
Date de soutenance : 25/11/2022

Résumé en langue originale

De nos jours, il est courant de traiter des problèmes à grande échelle et si nous prenons en compte la structure du problème, cela pourrait nous aider à améliorer les performances d'apprentissage. Dans ce travail, nous avons proposé des approches qui tiennent compte de la structure dans deux contextes: (i) les problèmes d'apprentissage par renforcement basés sur des modèles où nous avons réduit le regret (ii) les problèmes d'estimation de moyenne personnalisée en ligne où nous avons réduit la complexité de l'échantillon pour l'estimation moyenne.

Résumé traduit

Nowadays it is commonplace to deal with large scale problems and should we take problem structure into account, it could assist us toward improving learning performance. In this work, we have proposed approaches that take into account the structure in two settings: (i) model-based reinforcement learning problems where we have reduced the regret (ii) online personalized mean estimation problems where we have reduced the sample complexity for mean estimation.

Informations sur les contributeurs

Directeur(s) de thèse : Tommasi, Marc - Bellet, Aurélien
Président de jury : Jourdan, Laetitia
Membre(s) de jury : Pike-Burke, Ciara - Maillard, Odalric-Ambrym
Rapporteur(s) : Kadri, Hachem - Geist, Matthieu
Laboratoire : Centre de Recherche en Informatique, Signal et Automatique de Lille - Centre Inria de l'Université de Lille
École doctorale : École graduée Mathématiques, sciences du numérique et de leurs interactions (Lille ; 2021-....)

AUTEUR

Asadi, Mahsa

Droits d'auteur : Ce document est protégé en vertu du Code de la Propriété Intellectuelle.

Accès libre

Accéder au document