<?xml version="1.0" encoding="UTF-8"?><mets:mets xmlns:mets="http://www.loc.gov/METS/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:dcterms="http://purl.org/dc/terms/" xmlns:mads="http://www.loc.gov/mads/" xmlns:metsRights="http://cosimo.stanford.edu/sdr/metsrights/" xmlns:suj="http://www.theses.fr/namespace/sujets" xmlns:tef="http://www.abes.fr/abes/documents/tef" xmlns:tefextension="http://www.abes.fr/abes/documents/tefextension" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.loc.gov/METS/ http://www.abes.fr/abes/documents/tef/recommandation/tef_schemas.xsd">
<mets:metsHdr CREATEDATE="2024-06-03T12:30:55" ID="ABES.STAR.THESE_217458.METS_HEADER" LASTMODDATE="2024-12-21T04:26:46Z" RECORDSTATUS="valide">
<mets:agent ROLE="CREATOR">
<mets:name/>
<mets:note>Note</mets:note>
</mets:agent>
<mets:agent ROLE="DISSEMINATOR">
<mets:name>ABES</mets:name>
</mets:agent>
<mets:altRecordID ID="ABES.STAR.THESE_217458.METS_HEADER.ALTERNATE" TYPE=""/>
</mets:metsHdr>
<mets:dmdSec ID="ABES.STAR.THESE_217458.DESCRIPTION_BIBLIOGRAPHIQUE">
<mets:mdWrap MDTYPE="OTHER" OTHERMDTYPE="tef_desc_these">
<mets:xmlData>
<tef:thesisRecord>
<dc:title xml:lang="en">Solving pure exploration problems with the Top Two approach</dc:title>
<dcterms:alternative xml:lang="fr">Résoudre les problèmes d'exploration pure avec l'approche Top Two</dcterms:alternative>
<dc:subject xml:lang="fr">Prise de décision séquentielle</dc:subject>
<dc:subject xml:lang="fr">Problème de bandit à plusieurs bras</dc:subject>
<dc:subject xml:lang="fr">Exploration pure</dc:subject>
<dc:subject xml:lang="fr">Identification du meilleur bras</dc:subject>
<dc:subject xml:lang="en">Sequential decision making</dc:subject>
<dc:subject xml:lang="en">Multi-Armed bandits</dc:subject>
<dc:subject xml:lang="en">Pure exploration</dc:subject>
<dc:subject xml:lang="en">Best-Arm identification</dc:subject>
<dc:subject xsi:type="dcterms:DDC"/>
<tef:sujetRameau xml:lang="fr">
<tef:vedetteRameauNomCommun>
<tef:elementdEntree autoriteExterne="027231674" autoriteSource="Sudoc">Prise de décision (statistique)</tef:elementdEntree>
</tef:vedetteRameauNomCommun>
<tef:vedetteRameauNomCommun>
<tef:elementdEntree autoriteExterne="265227062" autoriteSource="Sudoc">Problème du bandit manchot</tef:elementdEntree>
</tef:vedetteRameauNomCommun>
<tef:vedetteRameauNomCommun>
<tef:elementdEntree autoriteExterne="035537671" autoriteSource="Sudoc">Échantillonnage adaptatif (statistique)</tef:elementdEntree>
</tef:vedetteRameauNomCommun>
<tef:vedetteRameauNomCommun>
<tef:elementdEntree autoriteExterne="027832139" autoriteSource="Sudoc">Tests d'hypothèses (statistique)</tef:elementdEntree>
</tef:vedetteRameauNomCommun>
</tef:sujetRameau>
<dcterms:abstract xml:lang="fr">Dans les problèmes d'exploration pure pour les bandits stochastiques à bras multiples,l'objectif est de répondre à des questions concernant un ensemble de distributions inconnues(modélisant par exemple l'efficacité d'un traitement) à partir desquelles nous pouvons collecterdes échantillons (mesurer son effet), et de fournir ensuite des garanties sur la réponse proposée.L'exemple archétypal est le problème de l'identification du meilleur bras, dans lequel l'agentcherche à identifier le bras étant le plus efficace en moyenne.Cette thèse s'intéresse à la classe des algorithmes Top Two, dans lesquels un leader estopposé à un challenger, ce qui oriente les efforts d'échantillonnage ultérieurs pour validerla supériorité du leader. Nous avons introduit une définition unifiée de l'approche Top Two,mettant en avant quatre composants importants. Compte tenu de leur simplicité, de leurinterprétabilité, de leur généralisation et de leur polyvalence, les algorithmes Top Two sontprometteurs pour être adoptés pour différentes applications. Cette thèse s'efforce d'établirl'approche Top Two comme une méthodologie fondée sur des principes statistiques, offrant desgaranties théoriques quasiment optimales ainsi que des performances empirique excellentes.Nous abordons différentes formulations de bandits stochastiques à plusieurs bras, avecdes classes de distributions variées ou des hypothèses structurelles sur les moyennes. Nousavons aussi étudié différents problèmes d'exploration pure, notamment l'identification dumeilleur bras ou d'un bras de qualité acceptable. La principale contribution de cette thèseréside dans l'obtention de garanties théoriques pour l'approche Top Two avec plusieurs mesuresde performance. Dans le cas où un niveau de confiance est donné, les algorithmes Top Twocollectent un nombre moyen d'échantillons qui est asymptotiquement optimal (lorsque leniveau de confiance tend vers un). Par ailleurs, nous proposons un algorithme Top Two quioffre à tout moment des garanties sur la probabilité de se tromper dans l'identification d'unbras de qualité acceptable.</dcterms:abstract>
<dcterms:abstract xml:lang="en">In pure exploration problems for stochastic multi-armed bandits, the objective is to answerinquiries regarding a set of unknown distributions (modeling for example the efficacy of atreatment) from which we can collect samples (measure its effect), and subsequently provideguarantees on the candidate answer. The archetypal example is the best arm identificationproblem, in which the agent aims at identifying the arm with the highest mean.This thesis delves into the class of Top Two algorithms, wherein a leader is pitted against achallenger, directing subsequent sampling efforts to validate the superiority of the leader. Weintroduce a unified definition of the Top Two approach, putting forward four key components.Given their simplicity, interpretability, generalizability, and versatility, Top Two algorithms arepromising for widespread adoption among practitioners. This thesis endeavors to establish theTop Two approach as a principled methodology offering nearly optimal theoretical guaranteesalongside state-of-the-art empirical performance.We address several stochastic multi-armed bandits settings, such as various classes ofdistributions or structural assumptions on the means. We also study different pure explorationproblems, including the identification of the best arm or one of acceptable quality. The principalcontribution of this thesis lies in establishing theoretical guarantees for the Top Two approachacross several performance metrics. In the fixed-confidence setting, we prove that many Top Twoalgorithms have an asymptotically optimal expected sample complexity (number of collectedsamples when the confidence level goes to one). In the anytime setting, we propose a Top Twoalgorithm which has guarantees on the probability of misidentifying a good enough arm atany time.</dcterms:abstract>
<dc:type>Electronic Thesis or Dissertation</dc:type>
<dc:type xsi:type="dcterms:DCMIType">Text</dc:type>
<dc:language xsi:type="dcterms:RFC3066">en</dc:language>
</tef:thesisRecord>
</mets:xmlData>
</mets:mdWrap>
</mets:dmdSec>
<mets:dmdSec ID="ABES.STAR.THESE_217458.VERSION_COMPLETE.DESCRIPTION.EDITION_ARCHIVAGE">
<mets:mdWrap MDTYPE="OTHER" OTHERMDTYPE="tef_desc_edition">
<mets:xmlData>
<tef:edition>
<dcterms:medium xsi:type="dcterms:IMT">PDF</dcterms:medium>
<dcterms:extent>3508640</dcterms:extent>
<dc:identifier xsi:type="dcterms:URI">https://pepite-depot.univ-lille.fr/LIBRE/EDMADIS/2024/2024ULILB011.pdf</dc:identifier>
<dc:identifier xsi:type="dcterms:URI"/>
<dc:identifier xsi:type="dcterms:URI">https://theses.hal.science/tel-04804590</dc:identifier>
<dc:identifier xsi:type="dcterms:URI">https://theses.hal.science/tel-04804590</dc:identifier>
<dc:identifier xsi:type="dcterms:URI">https://theses.fr/2024ULILB011/abes</dc:identifier>
<dc:identifier xsi:type="dcterms:URI">https://theses.hal.science/tel-04804590</dc:identifier>
<dc:identifier xsi:type="dcterms:URI">https://theses.hal.science/tel-04804590</dc:identifier>
<dc:identifier xsi:type="dcterms:URI">https://theses.hal.science/tel-04804590</dc:identifier>
</tef:edition>
</mets:xmlData>
</mets:mdWrap>
</mets:dmdSec>
<mets:amdSec>
<mets:techMD ID="ABES.STAR.THESE_217458.ADMINISTRATION">
<mets:mdWrap MDTYPE="OTHER" OTHERMDTYPE="tef_admin_these">
<mets:xmlData>
<tef:thesisAdmin>
<tef:auteur>
<tef:nom>Jourdan</tef:nom>
<tef:prenom>Marc</tef:prenom>
<tef:nomDeNaissance>Jourdan</tef:nomDeNaissance>
<tef:dateNaissance>1995-05-05</tef:dateNaissance>
<tef:nationalite scheme="ISO-3166-1">FR</tef:nationalite>
<tef:autoriteExterne autoriteSource="Sudoc">281676577</tef:autoriteExterne>
</tef:auteur>
<dc:identifier xsi:type="tef:nationalThesisPID">https://theses.fr/2024ULILB011</dc:identifier>
<dc:identifier xsi:type="tef:NNT">2024ULILB011</dc:identifier>
<dc:identifier xsi:type="tef:DOI">https://doi.org/10.70675/ca5c3644z5549z4170zba9cz535f50f6b133</dc:identifier>
<dcterms:dateAccepted xsi:type="dcterms:W3CDTF">2024-06-14</dcterms:dateAccepted>
<tef:thesis.degree>
<tef:thesis.degree.discipline xml:lang="fr">Informatique et applications</tef:thesis.degree.discipline>
<tef:thesis.degree.grantor>
<tef:nom>Université de Lille (2022-....)</tef:nom>
<tef:autoriteExterne autoriteSource="Sudoc">259265152</tef:autoriteExterne>
</tef:thesis.degree.grantor>
<tef:thesis.degree.level>Doctorat</tef:thesis.degree.level>
<tef:thesis.degree.name xml:lang="fr">Docteur es</tef:thesis.degree.name>
</tef:thesis.degree>
<tef:theseSurTravaux>non</tef:theseSurTravaux>
<tef:avisJury>oui</tef:avisJury>
<tef:directeurThese>
<tef:nom>Kaufmann</tef:nom>
<tef:prenom>Emilie</tef:prenom>
<tef:autoriteInterne>MADS_DIRECTEUR_DE_THESE_1</tef:autoriteInterne>
<tef:autoriteExterne autoriteSource="Sudoc">197040810</tef:autoriteExterne>
</tef:directeurThese>
<tef:directeurThese>
<tef:nom>Degenne</tef:nom>
<tef:prenom>Rémy</tef:prenom>
<tef:autoriteInterne>MADS_DIRECTEUR_DE_THESE_2</tef:autoriteInterne>
<tef:autoriteExterne autoriteSource="Sudoc">253866685</tef:autoriteExterne>
</tef:directeurThese>
<tef:presidentJury>
<tef:nom>Koolen</tef:nom>
<tef:prenom>Wouter</tef:prenom>
<tef:autoriteInterne>MADS_PRESIDENT_DU_JURY</tef:autoriteInterne>
<tef:autoriteExterne autoriteSource="Sudoc">281676046</tef:autoriteExterne>
</tef:presidentJury>
<tef:membreJury>
<tef:nom>Garivier</tef:nom>
<tef:prenom>Aurélien</tef:prenom>
<tef:autoriteInterne>MADS_MEMBRE_DU_JURY_1</tef:autoriteInterne>
<tef:autoriteExterne autoriteSource="Sudoc">111902495</tef:autoriteExterne>
</tef:membreJury>
<tef:rapporteur>
<tef:nom>Proutière</tef:nom>
<tef:prenom>Alexandre</tef:prenom>
<tef:autoriteInterne>MADS_RAPPORTEUR_1</tef:autoriteInterne>
<tef:autoriteExterne autoriteSource="Sudoc">17544126X</tef:autoriteExterne>
</tef:rapporteur>
<tef:rapporteur>
<tef:nom>Juneja</tef:nom>
<tef:prenom>Sandeep</tef:prenom>
<tef:autoriteInterne>MADS_RAPPORTEUR_2</tef:autoriteInterne>
<tef:autoriteExterne autoriteSource="Sudoc">281675872</tef:autoriteExterne>
</tef:rapporteur>
<tef:ecoleDoctorale>
<tef:nom>École graduée Mathématiques, sciences du numérique et de leurs interactions (Lille ; 2021-....)</tef:nom>
<tef:autoriteInterne>MADS_ECOLE_DOCTORALE_1</tef:autoriteInterne>
<tef:autoriteExterne autoriteSource="Sudoc">258621362</tef:autoriteExterne>
</tef:ecoleDoctorale>
<tef:partenaireRecherche type="laboratoire">
<tef:nom>Centre de Recherche en Informatique, Signal et Automatique de Lille</tef:nom>
<tef:autoriteInterne>MADS_PARTENAIRE_DE_RECHERCHE_1</tef:autoriteInterne>
<tef:autoriteExterne autoriteSource="labTEL">410272</tef:autoriteExterne>
<tef:autoriteExterne autoriteSource="Sudoc">18388695X</tef:autoriteExterne>
</tef:partenaireRecherche>
<tef:partenaireRecherche type="laboratoire">
<tef:nom>Centre Inria de l'Université de Lille</tef:nom>
<tef:autoriteInterne>MADS_PARTENAIRE_DE_RECHERCHE_2</tef:autoriteInterne>
<tef:autoriteExterne autoriteSource="labTEL">104752</tef:autoriteExterne>
<tef:autoriteExterne autoriteSource="Sudoc">185432247</tef:autoriteExterne>
</tef:partenaireRecherche>
<tef:oaiSetSpec>ddc:004</tef:oaiSetSpec>
<tef:MADSAuthority authorityID="MADS_DIRECTEUR_DE_THESE_1" type="personal">
<tef:personMADS>
<mads:namePart type="family">Kaufmann</mads:namePart>
<mads:namePart type="given">Emilie</mads:namePart>
</tef:personMADS>
</tef:MADSAuthority>
<tef:MADSAuthority authorityID="MADS_DIRECTEUR_DE_THESE_2" type="personal">
<tef:personMADS>
<mads:namePart type="family">Degenne</mads:namePart>
<mads:namePart type="given">Rémy</mads:namePart>
</tef:personMADS>
</tef:MADSAuthority>
<tef:MADSAuthority authorityID="MADS_PRESIDENT_DU_JURY" type="personal">
<tef:personMADS>
<mads:namePart type="family">Koolen</mads:namePart>
<mads:namePart type="given">Wouter</mads:namePart>
</tef:personMADS>
</tef:MADSAuthority>
<tef:MADSAuthority authorityID="MADS_MEMBRE_DU_JURY_1" type="personal">
<tef:personMADS>
<mads:namePart type="family">Garivier</mads:namePart>
<mads:namePart type="given">Aurélien</mads:namePart>
</tef:personMADS>
</tef:MADSAuthority>
<tef:MADSAuthority authorityID="MADS_RAPPORTEUR_1" type="personal">
<tef:personMADS>
<mads:namePart type="family">Proutière</mads:namePart>
<mads:namePart type="given">Alexandre</mads:namePart>
</tef:personMADS>
</tef:MADSAuthority>
<tef:MADSAuthority authorityID="MADS_RAPPORTEUR_2" type="personal">
<tef:personMADS>
<mads:namePart type="family">Juneja</mads:namePart>
<mads:namePart type="given">Sandeep</mads:namePart>
</tef:personMADS>
</tef:MADSAuthority>
<tef:MADSAuthority authorityID="MADS_ECOLE_DOCTORALE_1" type="corporate">
<tef:personMADS>
<mads:namePart type="family">École doctorale Mathématiques, sciences du numérique et de leurs interactions (Lille ; 2021-....)</mads:namePart>
</tef:personMADS>
</tef:MADSAuthority>
<tef:MADSAuthority authorityID="MADS_PARTENAIRE_DE_RECHERCHE_1" type="corporate">
<tef:personMADS>
<mads:namePart type="family">Centre de Recherche en Informatique, Signal et Automatique de Lille</mads:namePart>
</tef:personMADS>
</tef:MADSAuthority>
<tef:MADSAuthority authorityID="MADS_PARTENAIRE_DE_RECHERCHE_2" type="corporate">
<tef:personMADS>
<mads:namePart type="family">Centre Inria de l'Université de Lille</mads:namePart>
</tef:personMADS>
</tef:MADSAuthority>
</tef:thesisAdmin>
</mets:xmlData>
</mets:mdWrap>
</mets:techMD>
<mets:techMD ID="ABES.STAR.THESE_217458.VERSION_COMPLETE.EDITION_ARCHIVAGE.TECH_FICHIER.DOSSIER_1.DOSSIER_1.FICHIER_1">
<mets:mdWrap MDTYPE="OTHER" OTHERMDTYPE="tef_tech_fichier">
<mets:xmlData>
<tef:meta_fichier>
<tef:formatFichier>PDF</tef:formatFichier>
<tef:taille>3508640</tef:taille>
</tef:meta_fichier>
</mets:xmlData>
</mets:mdWrap>
</mets:techMD>
<mets:rightsMD ID="ABES.STAR.THESE_217458.DROITS_UNIVERSITE">
<mets:mdWrap MDTYPE="OTHER" OTHERMDTYPE="tef_droits_etablissement_these">
<mets:xmlData>
<metsRights:RightsDeclarationMD RIGHTSCATEGORY="CONTRACTUAL">
<metsRights:Context CONTEXTCLASS="GENERAL PUBLIC">
<metsRights:Permissions COPY="false" DELETE="false" DISPLAY="true" DUPLICATE="true" MODIFY="false" PRINT="true"/>
</metsRights:Context>
<metsRights:Context CONTEXTCLASS="INSTITUTIONAL AFFILIATE">
<metsRights:Permissions COPY="false" DELETE="false" DISPLAY="true" DUPLICATE="true" MODIFY="false" PRINT="true"/>
</metsRights:Context>
</metsRights:RightsDeclarationMD>
</mets:xmlData>
</mets:mdWrap>
</mets:rightsMD>
<mets:rightsMD ID="ABES.STAR.THESE_217458.DROITS_DOCTORANT">
<mets:mdWrap MDTYPE="OTHER" OTHERMDTYPE="tef_droits_auteur_these">
<mets:xmlData>
<metsRights:RightsDeclarationMD RIGHTSCATEGORY="CONTRACTUAL">
<metsRights:Context CONTEXTCLASS="GENERAL PUBLIC">
<metsRights:Permissions COPY="false" DELETE="false" DISPLAY="true" DUPLICATE="true" MODIFY="false" PRINT="true"/>
</metsRights:Context>
<metsRights:Context CONTEXTCLASS="INSTITUTIONAL AFFILIATE">
<metsRights:Permissions COPY="false" DELETE="false" DISPLAY="true" DUPLICATE="true" MODIFY="false" PRINT="true"/>
</metsRights:Context>
</metsRights:RightsDeclarationMD>
</mets:xmlData>
</mets:mdWrap>
</mets:rightsMD>
<mets:rightsMD ID="ABES.STAR.THESE_217458.VERSION_COMPLETE.DROITS">
<mets:mdWrap MDTYPE="OTHER" OTHERMDTYPE="tef_droits_version">
<mets:xmlData>
<metsRights:RightsDeclarationMD RIGHTSCATEGORY="CONTRACTUAL">
<metsRights:Context CONTEXTCLASS="GENERAL PUBLIC">
<metsRights:Permissions COPY="false" DELETE="false" DISPLAY="true" DUPLICATE="true" MODIFY="false" PRINT="true"/>
</metsRights:Context>
<metsRights:Context CONTEXTCLASS="INSTITUTIONAL AFFILIATE">
<metsRights:Permissions COPY="false" DELETE="false" DISPLAY="true" DUPLICATE="true" MODIFY="false" PRINT="true"/>
</metsRights:Context>
</metsRights:RightsDeclarationMD>
</mets:xmlData>
</mets:mdWrap>
</mets:rightsMD>
</mets:amdSec>
<mets:fileSec>
<mets:fileGrp ID="ABES.STAR.THESE_217458.VERSION_COMPLETE.EDITION_ARCHIVAGE.FILEGRP" USE="archive_et_diffusion">
<mets:file ADMID="ABES.STAR.THESE_217458.VERSION_COMPLETE.EDITION_ARCHIVAGE.TECH_FICHIER.DOSSIER_1.DOSSIER_1.FICHIER_1" ID="ABES.STAR.THESE_217458.VERSION_COMPLETE.EDITION_ARCHIVAGE.DOSSIER_1.DOSSIER_1.FICHIER_1" SEQ="1">
<mets:FLocat LOCTYPE="URL" xlink:href="ULIL/THESE_217458/document/0/0/These_JOURDAN_Marc.pdf"/>
</mets:file>
</mets:fileGrp>
</mets:fileSec>
<mets:structMap TYPE="logical">
<mets:div ADMID="ABES.STAR.THESE_217458.ADMINISTRATION ABES.STAR.THESE_217458.DROITS_UNIVERSITE ABES.STAR.THESE_217458.DROITS_DOCTORANT" CONTENTIDS="CONTENTIDS.ABES.STAR.THESE_217458" DMDID="ABES.STAR.THESE_217458.DESCRIPTION_BIBLIOGRAPHIQUE" TYPE="THESE">
<mets:div ADMID="ABES.STAR.THESE_217458.VERSION_COMPLETE.DROITS" CONTENTIDS="CONTENTIDS.ABES.STAR.THESE_217458.ABES.STAR.THESE_217458.VERSION_COMPLETE" TYPE="VERSION_COMPLETE">
<mets:div CONTENTIDS="CONTENTIDS.ABES.STAR.THESE_217458.VERSION_COMPLETE.EDITION_ARCHIVAGE" DMDID="ABES.STAR.THESE_217458.VERSION_COMPLETE.DESCRIPTION.EDITION_ARCHIVAGE" TYPE="EDITION">
<mets:fptr FILEID="ABES.STAR.THESE_217458.VERSION_COMPLETE.EDITION_ARCHIVAGE.FILEGRP"/>
</mets:div>
</mets:div>
</mets:div>
</mets:structMap>
</mets:mets>