<?xml version="1.0" encoding="UTF-8"?>
<mets:mets xmlns:mets="http://www.loc.gov/METS/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:dcterms="http://purl.org/dc/terms/" xmlns:local="http://roi.univ-lille1.fr/theses" xmlns:metsRights="http://cosimo.stanford.edu/sdr/metsrights/" xmlns:tef="http://www.abes.fr/abes/documents/tef" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.loc.gov/METS/tef_schemas.xsd">
<mets:dmdSec CREATED="2021-04-12T11:02:05" ID="id204966_desc_these">
<mets:mdWrap MDTYPE="OTHER" OTHERMDTYPE="tef_desc_these">
<mets:xmlData>
<tef:thesisRecord>
<dc:title xml:lang="fr">Algorithmes distribués d'extraction de connaissances</dc:title>
<dc:subject xml:lang="fr">Données -- Partitionnement</dc:subject>
<dc:subject xml:lang="fr">Classification non supervisée</dc:subject>
<dc:subject xml:lang="fr">Règles d'association (traitement des données)</dc:subject>
<dc:subject xml:lang="fr">Exploration de données -- Thèses et écrits académiques</dc:subject>
<dc:subject xml:lang="fr">Traitement réparti</dc:subject>
<dc:subject xml:lang="fr">Heuristique</dc:subject>
<dc:subject xml:lang="fr">Grilles informatiques</dc:subject>
<dc:subject xsi:type="dcterms:DDC">004.36</dc:subject>
<dcterms:abstract xml:lang="fr">Afin d'exploiter au mieux les ressources de traitement disponibles de type grille de calcul, pour la résolution de problèmes de data mining, il apparaît nécessaire de concevoir de nouveaux algorithmes spécialement adaptés à ce type d'architecture, et prenant en compte les spécifités d'exécution distribuée. Le projet DisDaMin (Distributed Data Mining) développé dans cette thèse, vise à proposer des solutions pour certains problèmes de data mining, tels que le problème de génération de règles d'association ou le problème de clustering (classification non supervisée). Pour le problème spécifique de génération de règles d'association, nous suggérons l'utilisation d'un partitionnement « intelligent » des données. Ce partitionnement intelligent peut être obtenu par clustering. Nous présentons donc un nouvel algorithme de clustering, appelé Clustering Distribué Progressif, qui exécute un clustering de manière progressive distribuée et efficace respectant les contraintes d'exécution sur grille de calculs. Les clusters de données issus de ce clustering sont par la suite utilisés pour des tâches de data mining. En particulier, les clusters sont utilisés, dans le travail présenté, pour aider à la résolution du problème de génération de règles d'association, afin d'en réduire la complexité de traitement. Nous introduisons un algorithme distribué pour le problème des règles d'association, appelée DICCoop (DIC Coopératif) et basé en partie sur l'utilisation du partitionnement « intelligent ». Chacun des algorithmes présentés est suivi d'un résumé des expérimentations qui ont permis de les valider comme heuristiques de data mining. Enfin, une synthèse des concepts distribués exploités dans les deux méthodes présentées conclut la présentation.</dcterms:abstract>
<dc:type xsi:type="dcterms:DCMIType">Text</dc:type>
<dc:type>Electronic Thesis or Dissertation</dc:type>
<dc:language xsi:type="dcterms:RFC3066">FR</dc:language>
</tef:thesisRecord>
</mets:xmlData>
</mets:mdWrap>
</mets:dmdSec>
<mets:dmdSec CREATED="2021-04-12T11:02:05" ID="id204966_desc_ed">
<mets:mdWrap MDTYPE="OTHER" OTHERMDTYPE="tef_desc_edition">
<mets:xmlData>
<tef:edition>
<dcterms:medium xsi:type="dcterms:IMT">application/pdf</dcterms:medium>
<dcterms:extent>1 : 3200596</dcterms:extent>
<dc:identifier xsi:type="dcterms:URI">https://pepite-depot.univ-lille.fr/LIBRE/Th_Num/2006/50376-2006-Fiolet.pdf</dc:identifier>
</tef:edition>
</mets:xmlData>
</mets:mdWrap>
</mets:dmdSec>
<mets:amdSec>
<mets:techMD ID="id204966_admin">
<mets:mdWrap MDTYPE="OTHER" OTHERMDTYPE="tef_admin_these">
<mets:xmlData>
<tef:thesisAdmin>
<tef:auteur>
<tef:nom>Fiolet</tef:nom>
<tef:prenom>Valérie</tef:prenom>
<tef:dateNaissance/>
<tef:nationalite scheme="ISO-3166-1"/>
</tef:auteur>
<dc:identifier xsi:type="tef:nationalThesisPID"/>
<dc:identifier xsi:type="tef:NNT">2006LIL10070</dc:identifier>
<dcterms:dateAccepted xsi:type="dcterms:W3CDTF">2006-01-01
</dcterms:dateAccepted>
<tef:thesis.degree>
<tef:thesis.degree.discipline xml:lang="fr">Informatique</tef:thesis.degree.discipline>
<tef:thesis.degree.grantor>
<tef:nom>Université Lille1 - Sciences et Technologies</tef:nom>
<tef:autoriteInterne>thesis.degree.grantor_1</tef:autoriteInterne>
<tef:autoriteExterne autoriteSource="Sudoc">026404184</tef:autoriteExterne>
</tef:thesis.degree.grantor>
<tef:thesis.degree.level>Doctorat</tef:thesis.degree.level>
</tef:thesis.degree>
<tef:theseSurTravaux>non</tef:theseSurTravaux>
<tef:avisJury>oui</tef:avisJury>
<tef:directeurThese>
<tef:nom>Toursel</tef:nom>
<tef:prenom>Bernard</tef:prenom>
</tef:directeurThese>
<tef:MADSAuthority authorityID="thesis.degree.grantor_1" type="corporate">
<tef:personMADS>
<namePart>Université Lille1 - Sciences et Technologies</namePart>
</tef:personMADS>
</tef:MADSAuthority>
</tef:thesisAdmin>
</mets:xmlData>
</mets:mdWrap>
</mets:techMD>
<mets:techMD ID="file_1">
<mets:mdWrap MDTYPE="OTHER" OTHERMDTYPE="tef_tech_fichier">
<mets:xmlData>
<tef:meta_fichier>
<tef:formatFichier/>
<tef:encodage>ASCII</tef:encodage>
<tef:taille>3200596</tef:taille>
</tef:meta_fichier>
</mets:xmlData>
</mets:mdWrap>
</mets:techMD>
<mets:rightsMD ID="id204966_etab">
<mets:mdWrap MDTYPE="OTHER" OTHERMDTYPE="tef_droits_etablissement_these">
<mets:xmlData>
<metsRights:RightsDeclarationMD>
<metsRights:Context CONTEXTCLASS="GENERAL PUBLIC">
<metsRights:Permissions COPY="true" DELETE="false" DISCOVER="true" DISPLAY="true" DUPLICATE="true" MODIFY="false" PRINT="true"/>
</metsRights:Context>
</metsRights:RightsDeclarationMD>
</mets:xmlData>
</mets:mdWrap>
</mets:rightsMD>
<mets:rightsMD ID="id204966_auteur">
<mets:mdWrap MDTYPE="OTHER" OTHERMDTYPE="tef_droits_auteur_these">
<mets:xmlData>
<metsRights:RightsDeclarationMD>
<metsRights:Context CONTEXTCLASS="GENERAL PUBLIC">
<metsRights:Permissions COPY="true" DELETE="false" DISCOVER="true" DISPLAY="true" DUPLICATE="true" MODIFY="false" PRINT="true"/>
</metsRights:Context>
</metsRights:RightsDeclarationMD>
</mets:xmlData>
</mets:mdWrap>
</mets:rightsMD>
<mets:rightsMD ID="id204966_copyright">
<mets:mdWrap MDTYPE="OTHER" OTHERMDTYPE="tef_droits_version">
<mets:xmlData>
<metsRights:RightsDeclarationMD>
<metsRights:Context CONTEXTCLASS="GENERAL PUBLIC">
<metsRights:Permissions COPY="true" DELETE="false" DISCOVER="true" DISPLAY="true" DUPLICATE="true" MODIFY="false" PRINT="true"/>
</metsRights:Context>
</metsRights:RightsDeclarationMD>
</mets:xmlData>
</mets:mdWrap>
</mets:rightsMD>
</mets:amdSec>
<mets:fileSec>
<mets:fileGrp ID="id204966_filegrp" USE="archive_et_diffusion">
<mets:file ADMID="file_1" ID="FID1" MIMETYPE="application/pdf" USE="maitre">
<mets:FLocat LOCTYPE="URL" xlink:href="https://pepite-depot.univ-lille.fr/LIBRE/Th_Num/2006/50376-2006-Fiolet.pdf"/>
</mets:file>
</mets:fileGrp>
</mets:fileSec>
</mets:mets>
