Exploration automatique de l'impact des paramètres de configuration sur les empreintes de navigateur
Automatic exploration of the impact of configuration parameters on browser fingerprints
- Sécurité
- Génie logicel
- Empreinte de navigateur
- Paramètres de configuration
- Suivi des utilisateurs
- Ingénierie des lignes de produits logiciels
- Navigateurs (logiciels)
- Traces numériques
- Protection de l'information (informatique)
- Systèmes informatiques -- Mesures de sûreté
- Génie logiciel
- Security
- Software ingeniering
- Fingerprint
- Langue : Anglais
- Discipline : Informatique et applications
- Identifiant : 2025ULILB028
- Type de thèse : Doctorat
- Date de soutenance : 26/11/2025
Résumé en langue originale
Les navigateurs web exposent de nombreux attributs d'API, créant des empreintes numériques uniques pour le suivi non consenti des utilisateurs.Face aux restrictions des méthodes traditionnelles (ex. cookies), les empreintes de navigateur s'imposent comme une alternative persistante, exploitant configurations et environnements d'exécution.L'impact des paramètres de configuration sur les empreintes est toutefois mal compris, freinant le développement de technologies de protection de la vie privée et la prise de décisions éclairées par les utilisateurs.Cette thèse aborde ces défis par une analyse empirique et une modélisation formelle pour approfondir la compréhension des empreintes de navigateur et de sa variabilité.Nous présentons trois contributions majeures, offrant des perspectives sur les configurations et les caractéristiques des empreintes.Premièrement, FP-Rainbow, une méthodologie automatisée analysant l'impact des paramètres de configuration sur les empreintes de navigateur.Une expérimentation sur 1,748 paramètres et 18 versions de Chromium a généré 61,559 empreintes, constituant l'étude systèmatique la plus exhaustive à ce jour sur l'impact des configurations.Notre analyse a identifié 32 à 56 paramètres clés qui impactent l'empreinte et a atteint 78,15 % de succès dans l'identification des paramètres à partir des empreintes du navigateur, prouvant leur impact direct et quantifié.Deuxièmement, nous introduisons une nouvelle représentation formelle par modélisation par caractéristiques (feature modeling) issue de l'ingénierie des lignes de produits logiciels pour capturer la variabilité des empreintes numériques.Notre méthode transforme les paires attribut-valeur en arbres hiérarchiques, préservant relations et contraintes.Elle facilite l'analyse avancée de la variabilité (échantillonnage, suivi d'évolution, exploration de l'espace de configuration) et réduit la taille des données jusqu'à 59,000 fois sans perte d'information.Troisièmement, nous étendons ces techniques aux paramètres de configuration et aux attributs environnementaux (OS, matériel, logiciel).En unifiant ces données, nous introduisons un langage de requête et une méthode pour extraire des empreintes minimales conservant des taux d'identification élevés.Ces contributions ont des implications multidisciplinaires.Pour la confidentialité, nos résultats offrent des preuves quantitatives pour éclairer les décisions des utilisateurs.Les développeurs peuvent utiliser nos outils pour évaluer l'impact sur la vie privée des nouvelles fonctionnalités et implémenter des configurations par défaut protectrices.Tous nos jeux de données, outils et méthodologies sont open-source, assurant reproductibilité et validation communautaire.Ces jeux de données complets intègrent informations détaillées sur les configurations matérielles, logicielles et les empreintes, facilitant diverses applications de recherche.Cette démarche favorise une compréhension approfondie des empreintes de navigateurs et soutient le développement de technologies efficaces de protection de la confidentialité.Ces travaux ouvrent des perspectives prometteuses : extension à d'autres navigateurs/plateformes, études longitudinales de l'évolution des empreintes, intégration du machine learning pour une analyse affinée, et développement de technologies de confidentialité de nouvelle génération.Nos méthodologies posent les bases d'une évaluation continue de la confidentialité face à l'évolution des technologies web.
Résumé traduit
Web browsers expose numerous API attributes, forming unique fingerprints that enable user tracking without consent.As traditional methods like cookies face restrictions, browser fingerprinting has become a persistent alternative leveraging browser configurations and execution environments.Yet, the impact of configuration parameters on fingerprint characteristics is poorly understood, hindering privacy-enhancing technology development and informed user decisions.This thesis addresses these challenges using empirical analysis and formal modeling to advance our understanding of browser fingerprinting and configuration variability.We present three main contributions offering comprehensive insights into browser configurations and fingerprint characteristics.First, FP-Rainbow, an automated methodology for analyzing how browser configuration parameters affect fingerprint characteristics.Through extensive experimentation across 1,748 configuration parameters and 18 versions of Chromium browser, we generated 61,559 browser fingerprints representing the most comprehensive systematic study of browser configuration impact to date.Our analysis identified 32 to 56 impactful parameters on the Browser Object Model and achieved 78.15 success in identifying configuration parameters from fingerprints, quantitatively proving configuration choices directly impact fingerprints.Second, we present a novel formal representation using feature modeling from Software Product Line Engineering to capture browser fingerprint variability.Our method transforms flat attribute-value pairs into hierarchical trees, preserving relationships and constraints.This approach enables advanced analysis of browser fingerprint variability, like fingerprint sampling, evolution tracking, and configuration space exploration, it also has a side effect of reducing the size by up to 59,000 times without loss of information.Third, we propose extending these feature modeling techniques to configuration parameters and environmental attributes (OS, Hardware, Software).By unifying all data, we introduce a query language and a method to extract minimal fingerprints that maintain high identification rates.These contributions have implications across multiple domains.For privacy, our findings offer quantitative evidence for informed user decisions on browser configurations.Browser developers can use our tools to assess new features privacy impact and implement privacy-preserving default configurations.All datasets, tools, and methodologies are open-source to ensure reproducible research and community validation.The comprehensive datasets include detailed hardware and software configuration information alongside browser fingerprints, facilitating diverse research applications.This commitment fosters a broader understanding of browser fingerprinting and supports developing effective privacy-enhancing technologies.This work opens promising future directions: extending to other browsers/platforms, longitudinal studies of fingerprint evolution, integrating machine learning for improved analysis, and developing next-generation privacy-enhancing technologies.Our methodologies provide a foundation for ongoing privacy assessment as web technologies evolve.
- Directeur(s) de thèse : Seinturier, Lionel - Quinton, Clément - Rudametkin, Walter
- Président de jury : Ben Mokhtar, Sonia
- Membre(s) de jury : Pawlowski, Estelle
- Rapporteur(s) : Francillon, Aurélien - Roca, Vincent
- Laboratoire : Centre de Recherche en Informatique, Signal et Automatique de Lille - Centre Inria de l'Université de Lille
- École doctorale : École graduée Mathématiques, sciences du numérique et de leurs interactions (Lille ; 2021-....)
AUTEUR
- Huyghe, Maxime


