Actualités du CATIE
Lancement de NERmembert par le département Algorithmes & Données
La NER, reconnaissance d’entités nommées, est un procédé de traitement automatique du langage naturel qui vise à identifier et classer les entités telles que les noms de personnes, lieux, organisations, etc… dans un texte non structuré.
Eh bien notre département algorithmes et données a développé sa propre version !
Loïck BOURDOIS, Data Scientist NLP au CATIE, a travaillé sur ces types de modèle en :
– Entraînant des modèles sur davantage de données et sans fuite (le précédent état de l’art était entraîné sur des leaks) ;
– Rendant accessible aux francophones le jeu de données d’entraînement : FrenchNER ;
– Proposant deux configurations : base et large, pour une précision plus poussée.
Cet outil peut vous servir à l’analyse d’e-mails, la recherche d’informations rapide dans un texte dense ou encore l’anonymisation des données.
En quelques secondes, vous pouvez repérer les lieux (LOC), personnes (PER) et organisations (ORG) dans votre texte. Pratique !
Si le sujet vous intéresse, vous pouvez dès à présent tester l’outil sur notre compte Hugging Face : https://lnkd.in/gpee7MZS