Actualités du CATIE
Heyyyyyy Macarena !
« OK Google ! Mets le réveil à 6h50 ». « Alexa, quel temps va-t-il faire demain ? ». La place des assistants vocaux va croissant. L’équipe Algorithmes et Données, qui porte une expertise sur les technologies de traitement du langage et de la voix, a mis au point un assistant vocal fonctionnant en local, sans connexion internet : Macarena.
Le rachat de SNIPS par SONOS a freiné les projets basés sur cette technologie qui avait la force de fonctionner en français et en anglais, en plus d’être adaptable à plusieurs cas d’usages.
Macarena fonctionne sur le principe du speech-to-text qui peut être développé suivant 2 méthodes : le deep-learning et une méthode hybride composée de deep-learning et de méthodes mathématiques d’analyse de voix
Macarena peut être utilisée en mode ‘WakeWord’ (vous l’activez via un mot-clé, sur le même principe que ‘Ok Google’) ou en mode Streaming (l’assistant sait répondre à des sollicitations sans être préalablement activé).
Nous présentons ici la technologie en plusieurs langues et sur un cas d’application de notre partenaire La Banque Postale.
Les 2 langues existantes (français et anglais) et utilisables indifféremment sont gérées en NLU (compréhension naturelle du langage) pour faciliter les échanges harmonieux entre l’utilisateur et Macarena. L’ajout de nouvelles langues est aisé avec un jeu de données idoine.
Au final, on a un assistant vocal « offline » dont les données ne quittent jamais l’appareil, léger et qui comprend (et répond en) plusieurs langues. Nous prouvons à travers différents démonstrateurs une couverture fonctionnelle équivalente à SNIPS.
Il existe certes d’autres solutions speech-to-text sur le marché mais il faudra désormais compter avec Macarena ! En plus d’un système fiable et robuste, elle seule offre une technologie d’assistant vocal totalement adaptable, tant au niveau des langues reconnues qu’à celui des termes techniques pouvant être compris.
Comme pour le premier assistant vocal développé par le CATIE, Macarena pourra certes être employée pour effectuer des virements bancaires, mais également pour commander des machines-outils, interagir avec des robots, etc. bref, être utilisée dans tout type d’industrie et même être embarquée pour des usines.
Nos experts travaillent dès à présent sur une version beta en méthode hybride qui permettra d’optimiser les performances, mieux traiter les accents, comprendre les phrases incomplètes ou mal structurées et gérer le bruit ou la multiplicité des voix lors des demandes.
Macarena pourrait alors être utilisée pour assister les téléconseillers ou des callbots, par exemple.
Si Google et Amazon proposent un produit fini avec ses assistants vocaux, nous mettons à disposition une technologie adaptable et transposable dans tous les secteurs professionnels et industriels.
L’Intelligence Artificielle en embarqué est un des thèmes stratégiques pour le CATIE, la technologie Macarena l’illustre parfaitement, en alignement avec l’initiative régionale autour de l’industrie du futur.
Pour en savoir plus, contactez-nous !