Damien Nouvel

MCF en TAL, Inalco, Paris, France

Un mot n'existe véritablement et à quelque point de vue qu'on se place que par la sanction qu'il reçoit de moment en moment de ceux qui 'lemploient (Saussure)

> English website...

Dans le cadre de mon doctorat, j'ai élaboré, développé et évalué un système de reconnaissance automatique des entités nommées (pour le moment, pour le français) qui s'appuie sur l'extraction de règles d'annotation (fouille de patrons). Ce système présente l'avantage de permettre la visualisation et la manipulation de motifs (hiérarchiques, séquentiels) corrélés à des marqueurs (balises) d'annotation extraits automatiquement.

Annoter des entités nommées en français avec le modèle Etape

mXS annote les entités nommées sur des textes en français par utilisation d'un modèle appris sur le corpus Etape. Sur un système Linux ou Mac, la procédure devrait être relativement simple (et est détaillée dans le fichier README) :

Disponibilité

Vous pouvez télécharger une version du système en ligne sur github, ici. C'est une version alpha mais qui devrait connaître pas mal d'évolutions dans les semaines à venir, n'hésitez pas à me contacter afin que je vous indique comment l'installer et l'utiliser !

Le système est décrit, notamment, dans la publication : Recognizing Named Entities using Automatically Extracted Transduction Rules (Nouvel et.al. 2011) [pdf]. Merci à Arnaud Soulet pour avoir fourni le squelette du système, et à Nathalie Friburger pour les éléments récupérés de CasEN.

Licence

Licence Creative Commons
mXS de Damien Nouvel est mis à disposition selon les termes de la licence Creative Commons Attribution 3.0 non transposé.
Fondé(e) sur une œuvre à https://damien.nouvels.net/fr/mxs.
Salutations mes homonymes et liens vers ceux qui ont un site, un carreleur en Bretagne, un docteur en économie, d'autres à venir 👋