Anton Tchechmedjiev - Interopérabilité sémantique multilingue des ressources lexicales en données lexicales liées ouvertes

07:00
Vendredi
14
Oct
2016
Lieu : 
Organisé par : 
Andon Tchechmedjiev
Intervenant : 
Andon Tchechmedjiev
Équipes : 

 

Membres du Jury :

  • M. Eric Gaussier, Université Grenoble Alpes, Pr, examinateur/président.
  • M. Roberto Navigli, Université Sapienza di Roma, Pr, rapporteur.
  • M. Mathieu Lafourcade, Université de Montpellier, MCF HDF, rapporteur.
  • M. Denis Maurel, Université François Rablais, Tours, Pr, examinateur.
  • M. Nabil Hathout, IRIT, Toulouse, DR CNRS, examinateur.
  • M. Gilles Sérasset, Université Grenoble Alpes, MCF, directeur de thèse. 
  • M. Jérôme Goulian, Université Grenoble Alpes, MCF, codirecteur de thèse. 
  • M. Didier Schwab, Université Grenoble Alpes, MCF, invité.

 

Lorsqu’il s’agit de la construction de ressources lexico-sémantiques multilingues, la première chose qui vient à l’esprit, est la nécessité que les ressources à aligner partagent le même format de données et la même représentation (interopérabilité représentationnelle). Avec l’apparition de standards tels que LMF et leur adaptation au web sémantique pour la production de ressources lexico-sémantiques multilingues en tant que données lexicales liées ouvertes (Ontolex), l’interopérabilité représentationnelle n’est plus un verrou majeur. Cependant, en ce qui concerne l’interopérabilité des alignements multilingues, le choix et la construction d’un pivot interlingue est l’un des obstacles principaux. Pour nombre de ressources (par exemple BabelNet, EuroWordNet), le choix est fait d’utiliser l’anglais, ou une autre langue, comme pivot interlingue. Ce choix mène à une perte de contraste dans les cas où des sens du pivot ont des lexicalisations différentes dans la même acception dans plusieurs autres langues. L’utilisation d’un pivot à acceptions interlingues, solution proposée il y a déjà plus de 20 ans, pourrait être viable. Néanmoins, leur construction manuelle est trop ardue du fait du manque d’experts parlant assez de langues et leur construction automatique pose problème du fait de l’absence d’une formalisation et d’une caractérisation axiomatique permettant de garantir leurs propriétés. Nous proposons dans cette thèse de d’abord formaliser l’architecture à pivot interlingue par acceptions, en développant une axiomatisation garantissant leurs propriétés. Nous proposons ensuite des algorithmes de construction initiale automatique en utili- sant les propriétés combinatoires du graphe des alignements bilingues ainsi que des algorithmes de mise à jour. Dans un deuxième temps, nous étudions les implications de l’application de ces algorithmes sur DBNary (une ressource en données lexicales liées ouvertes extraite à partir de Wiktionary).