Bikash Joshi - Algorithmes d'apprentissage pour les grandes masses de données : Application à la classification multi-classes et à l'optimisation distribuée asynchrone

12:00
Mardi
26
Sep
2017
Organisé par : 
Bikash Joshi
Intervenant : 
Bikash Joshi
Équipes : 

 

Lieu de soutenance :

Amphi C005 du site Ampère (en face de l'arrêt de tram Gabriel Fauré)

Membres du jury :

  • M. Stephane Canu, professeur à l'INSA de Rouen, rapporteur,
  • M. Thierry Artieres, professeur à l'Ecole Centrale Marseille, rapporteur,
  • Mme Marianne Clausel, professeur à l'Université de Nancy Lorraine, examinateur,
  • M. Jérôme Malick, directeur de recherche CNRS au Laboratoire Jean Kuntzmann, Univ. Grenoble Alpes, examinateur,
  • M. Massih-Reza Amini, professeur à l'Université Grenoble Alpes, directeur de thèse,
  • M. Franck Iutzeler, maître de conférences à l'Université Grenoble Alpes,co-encadrant de thèse.

 

L'objectif de cette thèse est de développer des algorithmes d'apprentissage adaptés aux grandes masses de données.

Dans un premier temps, nous considérons le problème de la classification avec un grand nombre de classes. Afin d'obtenir un algorithme adapté à la grande dimension, nous proposons un algorithme qui transforme le problème multi-classes en un problème de classification binaire que nous sous-échantillonnons de manière drastique. Afin de valider cette méthode, nous fournissons une analyse théorique et expérimentale détaillée. Dans la seconde partie, nous approchons le problème de l'apprentissage sur données distribuées en introduisant un cadre asynchrone pour le traitement des données.

Nous appliquons ce cadre à deux applications phares : la factorisation de matrice pour les systèmes de recommandation en grande dimension et la classification binaire.