Titre original :

Segmentation d'images de microscopie cellulaire par apprentissage profond dans des contextes très peu supervisés

Titre traduit :

Segmentation of cellular microscopy images by Deep Learning in very unsupervised contexts

Mots-clés en français :
  • Réseau de neurones convolutif
  • Segmentations d’images

  • Traitement d'images -- Techniques numériques
  • Apprentissage profond
  • Apprentissage supervisé (intelligence artificielle)
  • Réseaux neuronaux (informatique)
  • Données massives
  • Cellules
Mots-clés en anglais :
  • Segmentation
  • Deep Learning
  • Convolutional neural network

  • Langue : Français
  • Discipline : Traitement du signal et des images
  • Identifiant : 2022ULILB037
  • Type de thèse : Doctorat
  • Date de soutenance : 16/11/2022

Résumé en langue originale

La segmentation d'images est une problématique majeure en traitement d'images de microscopie. C'est un outil indispensable à l'automatisation d'analyses de structures microscopiques telles que les cellules vivantes. En particulier, comprendre comment des cellules se déforment et s'écoulent dans un réseau (type vaisseaux sanguins) est un enjeu d'importance. Pour ce cas d'étude, les images de microscopie peuvent parfois contenir d'autres structures artificielles, appelées micro-capsules et qui possèdent des propriétés mécaniques similaires à des cellules telles que les globules rouges.Indépendamment de la nature réelle ou artificielle de la micro-structure à segmenter, les méthodes à l'état de l'art en segmentation font appel à l'apprentissage profond par réseau de neurones avec par exemple des architectures de type U-net. Si le succès de ces méthodes en segmentation est indéniable, elles nécessitent une grande quantité de données annotées pour être déployées efficacement. Dans le cas de la segmentation, ces annotations prennent la forme de masques binaires résultant d'une annotation manuelle effectuée par un expert à l'aide d'un logiciel de contourage ce qui reste très fastidieux.Ces travaux de thèse visent à apprendre des modèles neuronaux en segmentation à l'aide de très peu d'images annotées (de l'ordre de grandeur de la dizaine) se plaçant ainsi dans un contexte dit de few-shot learning. Pour arriver à cet objectif, deux contributions sont proposées. Une première consiste à faire appel à de l'augmentation de données massives ce qui pose un problème d'allocation de moyens de calculs aux différents mécanismes d'augmentation possibles. Une approche s'appuyant sur l'algorithme HEDGE d'apprentissage en ligne est proposée. Une seconde contribution développe une méthodologie d'apprentissage relevant de l'auto-apprentissage (self-learning). L'originalité de cette méthodologie repose sur un scénario où un mentor préalable entraîné sur des données purement synthétique va accompagner un réseau apprenti durant son entraînement.

Résumé traduit

Image segmentation is a major issue in microscopy image processing. It is an essential tool for automating the analysis of microscopic structures such as living cells. In particular, understanding how cells deform and flow in a network (such as blood vessels) is an important issue. For this case of study, microscopy images can sometimes contain other artificial structures, called micro-capsules, which have mechanical properties similar to cells such as red blood cells.Regardless of the real or artificial nature of the micro-structure to be segmented, state-of-the-art segmentation methods use deep learning by neural networks with, for example, U-net type architectures. While the success of these methods in segmentation is undeniable, they require a large amount of annotated data to be deployed efficiently. In the case of segmentation, these annotations take the form of binary masks resulting from a manual annotation performed by an expert with the help of a contouring software, which remains very tedious.This thesis aims at learning neural models in segmentation using very few annotated images (of the order of a dozen), thus placing itself in a context called few-shot learning. To achieve this goal, two contributions are proposed. The first one consists in using massive data augmentation, which poses a problem of allocation of computational resources to the different possible augmentation mechanisms. An approach based on the HEDGE online learning algorithm is proposed. A second contribution develops a learning methodology based on self-learning. The originality of this methodology is based on a scenario where a mentor trained on purely synthetic data accompanies a learner network during its training.

  • Directeur(s) de thèse : Klein, John
  • Président de jury : Petitjean, Caroline
  • Membre(s) de jury : Versari, Cristian - Bugeau, Aurélie - Kaufmann, Emilie - Martinet, Jean
  • Rapporteur(s) : Benoît, Alexandre - Alahari, Karteek
  • Laboratoire : BioComputing
  • École doctorale : Ecole doctorale Mathématiques, sciences du numérique et de leurs interactions (Lille)

AUTEUR

  • Deleruyelle, Arnaud
Droits d'auteur : Ce document est protégé en vertu du Code de la Propriété Intellectuelle.
Accès libre