Hybrid parallel metaheuristics for molecular docking on computational grids
Métaheuristiques parallèles hybrides pour le docking moléculaire de protéines sur grilles de calcul
- Arrimage moléculaire
- Protéines -- Conformation
- Heuristique
- Parallélisme (informatique)
- Grilles informatiques
- Calcul intensif (informatique)
- Bioinformatique
- Langue : Anglais
- Discipline : Computer Science
- Identifiant : 2009LIL10166
- Type de thèse : Doctorat
- Date de soutenance : 04/06/2009
Résumé en langue originale
Cette thèse porte sur les méta-heuristiques hiérarchiques parallèles adaptatives pour l'échantillonnage conformationnel. Étant un problème hautement combinatoire et multlmodal, l'échantillonnage conformationnel requière la construction d'approches hybrides à large échelle. Après une analyse dei modèles mathématiques, nécessitant l'examen des différentes formulations du champ de force, nous avons proposé une étude des opérateurs de variation et des méthodes de recherche locale adaptés au problème ainsi que leur hybridation dynamique et adaptative. Cette étude nous a conduit à la proposition de mécanismes d'adaptation des paramètres des algorithmes utilisés en fonction du processus d'évolution. Dans cette thèse, nous proposons également des algorithmes adaptatifs hybndes hiérarchiques distribués, fortement extensibles. L'expérimentation, basée sur l'utilisation de multiples modèles parallèles, démontre la grande efficacité de ces algorithmes. En effet, les résultats obtenus montrent que des RMSD moyens en dessous de 1.0 A peuvent être obtenus sur des instances difficiles des problèmes de prédiction de la structure des protéines et de docking moléculaire. La validation des approches hybrides proposées a été effectuée sur Grid'5000, une grille expérimentale d'échelle nationale composée d'environ 5000 coeurs de calcul. Une image système a été développée en utilisant Globus pour permettre des déploiements distribués à large échelle. L'approche hiérarchique distribuée construite a été ainsi déployée sur plusieurs grappes, avec près de 1000 coeurs de calcul.
Résumé traduit
The thesis proposes an extensive analysis of adaptive hierarchical parallel metaheuristics for ab initio conformational sampling. Standing as an NP, combinatorial, highly multi-modal optimization problem, conformational sampling requires for high-performance large scale hybrid approaches to be constructed. Following an incremental definition, minimum complexity conformational sampling mathematical models are first analyzed, entailing a review of different force field formulations. A comprehensive analysis is conducted on a large set of operators and local search algorithms including adaptive and dynamic mechanisms. As determined by the analysis outcomes, complex a priori and online parameter tuning stages are designed. finally, highly scalable hierarchical hybrid distributed algorithm designs are proposed. Experimentation is carried over multiple parallelization models with afferent cooperation topologies. Expenmentations resulted in unprecedented results to be obtained. Multiple perfect conformational matches have been determined, on highly difficult protein structure prediction and molecular docking benchmarks, with RMSD average values below 1.0A. The validation of the proposed hybrid approaehes was performed on Grid'5000, a French computational grid, with almost 5000 computational cores. A Globus Toolkit hased Grid'SOOO system image has been developed, sustaining large scale distributed deployments. The constructed hierarchical hybrid distributed algorithm has been deployed on multiple clusters, with almost 1000 computing cores. Finally, a parallel AutoDock version was developed using the ParadisEO framework, integrating the developed algorithms.
- Directeur(s) de thèse : Talbi, El-Ghazali - Melab, Nouredine
AUTEUR
- Tantar, Alexandru-Adrian