Raphaël Laurent - COSMO : un modèle bayésien des interactions sensori-motrices dans la perception de la parole

12:30
Mercredi
8
Oct
2014
Organisé par : 
Pierre Bessière
Intervenant : 
Raphaël Laurent
Équipes : 

Thèse préparée au sein des laboratoires Gipsa-Lab,  LIG et  LPNC et dirigée par  Julien DIARD, directeur de thèse, Jean-Luc SCHWARTZ et Pierre BESSIÈRE co-directeurs de thèse.
 

Lieu de Soutenance de la Thèse : Amphitéâtre de la Maison des Sciences de l'Homme, 1221 avenue centrale - Domaine universitaire - St Martin d'Hères
 

Membres du jury :

  • BESSIÈRE Pierre, DR CNRS, Institut des Systèmes Intelligents et de Robotique , co-directeur de thèse
  • DIARD Julien, CR CNRS, Laboratoire de Psychologie et NeuroCognition , directeur de thèse
  • DUPOUX Emmanuel, professeur EHESS, Laboratoire de Sciences Cognitives et Psycholinguistique, rapporteur
  • LAPRIE Yves, DR CNRS, Laboratoire lOrrain de Recherche en Informatique et ses Applications , rapporteur
  • MOORE Roger, Chair of Spoken Language Processing, University of Sheffield , examinateur
  • OUDEYER Pierre-Yves, DR CNRS, Institut National de Recherche en Informatique et en Automatique , examinateur
  • PERRIER Pascal, professeur INP, GIPSA-Lab - Département Parole et Cognition , examinateur,
  • SCHWARTZ Jean-Luc, DR CNRS, GIPSA-Lab - Département Parole et Cognition, co-directeur de thèse
 

Si la parole est une faculté dont l’usage nous semble tout à fait naturel, il reste toutefois beaucoup à comprendre sur la nature des représentations et des processus cognitifs qui la gouvernent. Au coeur de cette thèse se trouve la question des interactions entre perception et action dans la production et la perception de syllabes. Nous adoptons le cadre de la programmation bayésienne au sein duquel nous définissons mathématiquement le modèle COSMO (pour "Communicating Objects using Sensori-Motor Operations"), qui permet de formaliser et d’étudier quantitativement les théories de la communication parlée. Nous mettons en évidence des conditions idéales d’apprentissage sous lesquelles les théories motrice et auditive sont indistinguables. Pour s’en éloigner, nous proposons un algorithme d’apprentissage sensorimoteur "par accommodation", qui permet de s’adapter au bain acoustique ambiant tout en développant des idiosyncrasies. Nous discutons les dynamiques d’évolution ainsi que la robustesse aux dégradations des modèles appris.

MOTS CLES : 

Perception de la parole, cognition, modélisation computationelle, interactions sensori-motrices, programmation bayésienne, apprentissage.