<?xml version="1.0" encoding="UTF-8"?>
<mets:mets xmlns:mets="http://www.loc.gov/METS/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:dcterms="http://purl.org/dc/terms/" xmlns:mads="http://www.loc.gov/mads/" xmlns:metsRights="http://cosimo.stanford.edu/sdr/metsrights/" xmlns:tef="http://www.abes.fr/abes/documents/tef" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<mets:metsHdr CREATEDATE="2021-04-12T10:01:05" ID="univ-lille-2476" LASTMODDATE="2021-04-12T12:13:35" RECORDSTATUS="complet">
<mets:agent ROLE="CREATOR">
<mets:name>Université Lille 2 Droit et Santé</mets:name>
</mets:agent>
</mets:metsHdr>
<mets:dmdSec CREATED="2021-04-12T10:01:05" ID="desc_expr">
<mets:mdWrap MDTYPE="OTHER" OTHERMDTYPE="tef_desc_these">
<mets:xmlData>
<tef:thesisRecord>
<dc:title xml:lang="fr">Dé-identification automatisée de courriers médicaux : proposition et évaluation de la méthode FASDIM</dc:title>
<dc:subject xml:lang="fr">Anonymisation, dé-identification, confidentialité, secret médical, Natural
Language Processing, Traitement Automatisé de Langage</dc:subject>
<dc:subject xsi:type="dcterms:DDC">610</dc:subject>
<tef:sujetRameau>
<tef:vedetteRameauNomCommun>
<tef:elementdEntree autoriteExterne="027985830" autoriteSource="Sudoc">Traitement automatique du langage naturel</tef:elementdEntree>
</tef:vedetteRameauNomCommun>
<tef:vedetteRameauNomCommun>
<tef:elementdEntree autoriteExterne="027346374" autoriteSource="Sudoc">Secret médical</tef:elementdEntree>
</tef:vedetteRameauNomCommun>
<tef:vedetteRameauNomCommun>
<tef:elementdEntree autoriteExterne="02801877X" autoriteSource="Sudoc">Protection de l'information (informatique)</tef:elementdEntree>
</tef:vedetteRameauNomCommun>
<tef:vedetteRameauNomCommun>
<tef:elementdEntree autoriteExterne="040745473" autoriteSource="Sudoc.FMesh">Traitement du langage naturel</tef:elementdEntree>
</tef:vedetteRameauNomCommun>
<tef:vedetteRameauNomCommun>
<tef:elementdEntree autoriteExterne="04068590X" autoriteSource="Sudoc.FMesh">Confidentialité</tef:elementdEntree>
</tef:vedetteRameauNomCommun>
</tef:sujetRameau>
<dcterms:abstract xml:lang="fr">Contexte : Les données médicales contenues dans les courriers médicaux constituent une
source importante d’information pour la recherche clinique et les actions de Santé Publique.
Ces données ne sont exploitables que si la vie privée du patient est respectée, ce qui peut être
obtenu par la dé-identification des courriers médicaux, aussi appelée « anonymisation ». La
dé-identification consiste à supprimer dans un document toutes les données directement ou
indirectement nominatives permettant d’identifier une personne. Afin de traiter un grand
nombre de courriers, la méthode de dé-identification doit être automatisée, cependant aucune
méthode n’existe en langue française.
Matériel et méthode : FASDIM est une méthode simple et rapide de dé-identification de
courriers médicaux en texte libre, permettant de supprimer les données identifiantes
(Protected Health Information ou "PHI"). La méthode repose sur la création d'une liste de
mots autorisés, associée à la création d'une liste de motifs dans lesquels les nombres sont
protégés. Ensuite, les mots non autorisés ainsi que les nombres non protégés au préalable sont
supprimés du texte. Enfin, FASDIM est évalué sur trois aspects: 1) efficacité à supprimer les
données identifiantes, 2) perte d'information médicale engendrée par la méthode, 3) temps de
travail nécessaire à sa mise en place et sa mise à jour.
Résultats : FASDIM permet de dé-identifier les courriers médicaux non structurés en langue
française avec un rappel de 98,1 % et une précision de 79,6 %, soit une F-measure à 87,9 %,
ce qui garantit la confidentialité des documents. L’évaluation de la perte d’information
montre un taux de conservation de l’information médicale de 99,02 %. Le temps requis pour
implémenter la méthode est d’une quarantaine d’heure. FASDIM est donc un outil simple,
rapide à mettre en place et permettant de préserver la vie privée du patient.</dcterms:abstract>
<dcterms:abstract xml:lang="en">...</dcterms:abstract>
<dc:type>Electronic Thesis or Dissertation</dc:type>
<dc:type xsi:type="dcterms:DCMIType">Text</dc:type>
<dc:language xsi:type="dcterms:RFC3066">fr</dc:language>
</tef:thesisRecord>
</mets:xmlData>
</mets:mdWrap>
</mets:dmdSec>
<mets:dmdSec CREATED="2021-04-12T10:01:05" ID="desc_edition">
<mets:mdWrap MDTYPE="OTHER" OTHERMDTYPE="tef_desc_edition">
<mets:xmlData>
<tef:edition>
<dcterms:medium xsi:type="dcterms:IMT">application/pdf</dcterms:medium>
<dcterms:extent>1 : 0 Ko</dcterms:extent>
<dc:identifier xsi:type="dcterms:URI">https://pepite-depot.univ-lille.fr/LIBRE/Th_Medecine/2012/LIL2_STME_2012_008.pdf</dc:identifier>
</tef:edition>
</mets:xmlData>
</mets:mdWrap>
</mets:dmdSec>
<mets:amdSec>
<mets:techMD ID="admin_expr">
<mets:mdWrap MDTYPE="OTHER" OTHERMDTYPE="tef_admin_these">
<mets:xmlData>
<tef:thesisAdmin>
<tef:auteur>
<tef:nom>Mouret-Kubiak</tef:nom>
<tef:prenom>Capucine</tef:prenom>
<tef:dateNaissance>1982-09-02</tef:dateNaissance>
<tef:nationalite scheme="ISO-3166-1">FR</tef:nationalite>
<tef:autoriteExterne autoriteSource="Sudoc">160774209</tef:autoriteExterne>
<tef:autoriteExterne autoriteSource="LDAP">73644</tef:autoriteExterne>
</tef:auteur>
<dc:identifier xsi:type="tef:NNT">2012LIL2M008</dc:identifier>
<dcterms:dateAccepted xsi:type="dcterms:W3CDTF">2012-01-17</dcterms:dateAccepted>
<tef:thesis.degree>
<tef:thesis.degree.discipline xml:lang="fr">Médecine du travail</tef:thesis.degree.discipline>
<tef:thesis.degree.grantor>
<tef:nom>Université Lille 2 Droit et Santé</tef:nom>
<tef:autoriteInterne>thesis.degree.grantor_1</tef:autoriteInterne>
<tef:autoriteExterne autoriteSource="Sudoc">026404389</tef:autoriteExterne>
</tef:thesis.degree.grantor>
<tef:thesis.degree.level>Doctorat de médecine</tef:thesis.degree.level>
</tef:thesis.degree>
<tef:theseSurTravaux>non</tef:theseSurTravaux>
<tef:avisJury>oui</tef:avisJury>
<tef:directeurThese>
<tef:nom>Chazard</tef:nom>
<tef:prenom>Emmanuel</tef:prenom>
<tef:autoriteInterne>intervenant_1</tef:autoriteInterne>
<tef:autoriteExterne autoriteSource="Sudoc">103895019</tef:autoriteExterne>
</tef:directeurThese>
<tef:oaiSetSpec>ddc:610</tef:oaiSetSpec>
<tef:MADSAuthority authorityID="intervenant_1" type="personal">
<tef:personMADS>
<mads:namePart type="family">Chazard</mads:namePart>
<mads:namePart type="given">Emmanuel</mads:namePart>
</tef:personMADS>
</tef:MADSAuthority>
<tef:MADSAuthority authorityID="thesis.degree.grantor_1" type="corporate">
<tef:personMADS>
<mads:namePart>Université Lille 2 Droit et Santé</mads:namePart>
<mads:description>Université Lille 2 Droit et Santé</mads:description>
</tef:personMADS>
</tef:MADSAuthority>
</tef:thesisAdmin>
</mets:xmlData>
</mets:mdWrap>
</mets:techMD>
<mets:techMD ID="file_1">
<mets:mdWrap MDTYPE="OTHER" OTHERMDTYPE="tef_tech_fichier">
<mets:xmlData>
<tef:meta_fichier>
<tef:encodage>ASCII</tef:encodage>
<tef:formatFichier>PDF</tef:formatFichier>
<tef:taille>1</tef:taille>
</tef:meta_fichier>
</mets:xmlData>
</mets:mdWrap>
</mets:techMD>
<mets:rightsMD ID="dr_expr_thesard">
<mets:mdWrap MDTYPE="OTHER" OTHERMDTYPE="tef_droits_auteur_these">
<mets:xmlData>
<metsRights:RightsDeclarationMD>
<metsRights:Context CONTEXTCLASS="GENERAL PUBLIC">
<metsRights:Permissions COPY="true" DELETE="false" DISCOVER="true" DISPLAY="true" DUPLICATE="true" MODIFY="false" PRINT="true"/>
</metsRights:Context>
</metsRights:RightsDeclarationMD>
</mets:xmlData>
</mets:mdWrap>
</mets:rightsMD>
<mets:rightsMD ID="dr_expr_univ">
<mets:mdWrap MDTYPE="OTHER" OTHERMDTYPE="tef_droits_etablissement_these">
<mets:xmlData>
<metsRights:RightsDeclarationMD>
<metsRights:Context CONTEXTCLASS="GENERAL PUBLIC">
<metsRights:Permissions COPY="true" DELETE="false" DISCOVER="true" DISPLAY="true" DUPLICATE="true" MODIFY="false" PRINT="true"/>
</metsRights:Context>
</metsRights:RightsDeclarationMD>
</mets:xmlData>
</mets:mdWrap>
</mets:rightsMD>
<mets:rightsMD ID="dr_version">
<mets:mdWrap MDTYPE="OTHER" OTHERMDTYPE="tef_droits_version">
<mets:xmlData>
<metsRights:RightsDeclarationMD>
<metsRights:Context CONTEXTCLASS="GENERAL PUBLIC">
<metsRights:Permissions COPY="true" DELETE="false" DISCOVER="true" DISPLAY="true" DUPLICATE="true" MODIFY="false" PRINT="true"/>
</metsRights:Context>
</metsRights:RightsDeclarationMD>
</mets:xmlData>
</mets:mdWrap>
</mets:rightsMD>
</mets:amdSec>
<mets:fileSec>
<mets:fileGrp ID="FGrID1" USE="archive_et_diffusion">
<mets:file ADMID="file_1" ID="FID1" MIMETYPE="application/pdf" USE="maitre">
<mets:FLocat LOCTYPE="URL" xlink:href="https://pepite-depot.univ-lille.fr/LIBRE/Th_Medecine/2012/LIL2_STME_2012_008.pdf"/>
</mets:file>
</mets:fileGrp>
</mets:fileSec>
<mets:structMap TYPE="logical">
<mets:div ADMID="dr_expr_thesard dr_expr_univ admin_expr" CONTENTIDS="www.univ-lille.fr/uid/univ-lille-2476/oeuvre" DMDID="desc_expr" TYPE="THESE">
<mets:div ADMID="dr_version" CONTENTIDS="www.univ-lille.fr/uid/univ-lille-2476/oeuvre/version" TYPE="VERSION_COMPLETE">
<mets:div CONTENTIDS="www.univ-lille.fr/uid/univ-lille-2476/oeuvre/version/edition" DMDID="desc_edition" TYPE="EDITION">
<mets:fptr FILEID="FGrID1"/>
</mets:div>
</mets:div>
</mets:div>
</mets:structMap>
</mets:mets>
