MCF en TAL, Inalco, Paris, France
When a measure becomes a target, it ceases to be a good measure (M. Strathern / C. Goodhart)
Depuis septembre 2014, je suis maître de conférences à l'Inalco au sein du laboratoire ERTIM, et directeur de cette équipe depuis 2020. J'y travaille dans le domaine du traitement automatique des langues (TAL) avec un intérêt plus particulier pour les modèles mathématiques et le multilinguisme, dont quelques langues enseignées à l'Inalco (quechua, arabe, bambara, chinois, etc.) pour des objectifs variés (translittération, désambiguisation lexicale, opinion, analyse textométrique, etc.). Comme enseignant chercheur, je dispense des cours (parcours de licence et master TAL), notamment liés à l'informatique et au TAL, de la L2 au M2, ou encore en encadrant des doctorats et des mémoires M2.
En 2013/2014, j'ai été postdoc au LIMSI-CNRS (Université Paris-Sud 11), où je travaillais sur l'extraction d'information à partir de flux de textes issus de la reconnaissance de la parole (projet ANR VERA). J'y ai aussi travaillé sur l'analyse automatique de documents de spécifications (projet Systematic ProjEstimate). En 2012/2013, j'étais ingénieur de recherche (CDD/postdoc) à Alpage (INRIA), où j'ai travaillé sur la détection et l'inférence de propriété de mots inconnus dans des dépêches d'actualité (néologismes, entités nommées, etc.) afin de les intégrer semi-automatiquement aux lexiques (projet ANR EDyLex).
Précédemment, j'ai été doctorant (2009-2012) au sein de l'équipe Bases de Données et Traitement des Langues Naturelles (BDTLN) du Laboratoire d'Informatique et moniteur au Département d'Informatique à l'université François Rabelais Tours. Mon doctorat a été dirigé par Jean-Yves Antoine et co-encadré par Arnaud Soulet et Nathalie Friburger. Soutenu le 20 novembre 2012, il a porté sur la reconnaissance automatique d'entités nommées à l'aide de règles d'annotation (symboliques) explorées et extraites par fouille de données (séquentielles, hiérarchiques). Tout ceci plus particulièrement dans le cadre du traitement de la parole (projets ANR ESTER et ETAPE).