Adrien Faure - Simulation avancée pour la gestion de ressources des superordinateurs

10:30
Mercredi
2
Déc
2020
Intervenant : 
Adrien Faure
Équipes : 

 

Composition du jury :

  • Georges DA COSTA, Maître de conférence, IRIT, Université de Toulouse III, rapporteur
  • Frédéric SUTER, directeur de recherche, IN2P3, France, rapporteur, examinateur
  • Adrien LÈBRE , professeur à IMT Atlantique, France, examinateur
  • Yves DENNEULIN, Grenoble INP, examinateur
  • Pascale ROSSE-LAURENT, architecte logiciel à Atos, France, encadrant
  • Olivier RICHARD, maître de conférences, LIG, Univ. Grenoble Alpes, France, encadrant
  • Denis TRYSTRAM, professeur des universités, LIG, Grenoble INP, France, encadrant

Les superordinateurs sont des systèmes mutualisant la puissance de milliers de cœurs de calculs dédiés à la résolution des problèmes compliqués de notre société. Le gestionnaire de ressources est un système distribué et complexe chargé de la gestion de ses ressources de calculs. Son rôle est multiple: Gérer la plateforme physique et traiter les requêtes d'accès des utilisateurs au superordinateur. La pierre angulaire du gestionnaire de ressources est son algorithme d'ordonnancement des requêtes des utilisateurs. L'ordonnancement est un problème difficile; pour gérer efficacement un superordinateur le gestionnaire de ressources doit disposer d'heuristiques d'ordonnancement efficaces permettant de prendre des décisions pertinentes sur des milliers de ressources de calculs. Évaluer et tester de nouvelles heuristiques est fondamental avant de pouvoir les utiliser dans un système en production.  
Toute panne induite par une nouvelle politique peut avoir des conséquences importantes sur la qualité de service du superordinateur.  
Il est ainsi nécessaire de disposer d'outils et méthodes dédiés à l'évaluation des algorithmes d'ordonnancement.  
La première partie de ce document présente un nouvel algorithme d'ordonnancement, ainsi que son évaluation par le biais de la simulation.  
L'algorithme en question repose sur la possibilité de rediriger les programmes des utilisateurs en cours d'exécution.  
L'évaluation est réalisée par le biais d'une large campagne de simulation, et montre que rediriger des programmes permet d'améliorer les performances de l'ordonnancement. 
L'objectif principal de la seconde partie de ce document est de proposer et développer de nouveaux outils et méthodes pour l'évaluation des gestionnaires de ressources.  
Cette seconde partie est elle même divisée en deux arcs: Nous proposons dans un premier temps d'étendre les techniques de simulations d’algorithmes d'ordonnancement avec des modèles dédiés aux programmes permettant ainsi la simulation d'interférences réseaux entre les différents programmes.  
Dans un second temps, nous proposons deux nouvelles approches pour créer des expériences sur un seul ordinateur, en se basant directement sur de vrais gestionnaires de ressources.  
L'objectif de ces travaux est d'étendre le paysage expérimental des outils et méthodologies nécessaires à l'évaluation de nouveaux algorithmes d'ordonnancement.