La branche de Google qui travaille sur la recherche et le développement d’intelligences artificielles s’est penchée sur un nouvel outil de traduction des langues, et son dernier produit Google Translatotron pourrait surpasser la concurrence, y compris DeepL.
Pour un usage professionnel, personnel ou quotidien, bon nombre d’entre nous ont recours aux services de Google Traduction, de Reverso ou de DeepL pour traduire un texte, comprendre une phrase, un mot vocabulaire, etc. On les utilise même parfois pour nos déplacements à l’étranger quand on ne maîtrise pas très bien la langue locale.
Toutefois, le point noir au tableau, c’est que malgré leur efficacité, ces outils sont encore très mécaniques et sont loins de nous donner une traduction 100% correcte ni une intonation naturelle au moment de prononcer le résultat.
Pour améliorer cet aspect, Google AI s’est ainsi penché sur la conception d’un nouvel outil d’intelligence artificielle, dénommé Translatotron.
Translatotron permettra de faire de la traduction live d’une discussion
L’avantage avec ce programme est le fait qu’il convertira directement une entrée audio en sortie audio. En d’autres termes, il n’a pas besoin de passer par d’autres étapes pour vous fournir la traduction demandée, un peu comme les Pixel Buds dont on vous parlait il y a quelques mois.
Prenons Google Traduction pour exemple. Lorsque vous voulez traduire un fichier audio à l’aide de ce service, il va d’abord convertir cet audio en texte dans la langue utilisée. Puis il va traduire le texte dans la langue demandée avant de prononcer ladite traduction avec sa voix machinale.
Avec Translatotron, pas besoin de passer par la phase de conversion ou de traduction du texte. L’application vous livre de suite la traduction vocale de l’audio dans la langue souhaitée.
Translatotron n’est pas encore opérationnel
Pour arriver à ce résultat, Google AI a expliqué sur la revue arXiv du vendredi 12 avril 2019 que Translatotron est doté de 3 composants qui vont servir à donner la meilleure traduction possible :
- Le premier composant utilise un réseau neuronal qui va associer le spectrogramme audio dans la langue originale au spectrogramme audio dans la langue souhaitée
- Le deuxième convertira le spectrogramme en onde audio
- et le dernier s’occupera de l’intonation de la voix pour faire la version finale avec les caractéristiques vocales d’origine
Bien que ce nouvel outil promette d’être plus efficace que les outils antérieurs, Google AI déclare qu’il n’est pas encore au point même si les résultats sont prometteurs. Il faudra donc encore patienter quelques temps avant de pouvoir profiter de ce service, dont vous pouvez déjà voir le potentiel en vous rendant à cette adresse.