Oubliez Google Traduction. L’entreprise présente Translatotron, le premier outil capable de traduire directement la parole d’une langue à une autre.
Nous sommes peut-être sur le point d’atteindre l’étrange vallée en ce qui concerne la traduction en temps réel du mot parlé. C’est déjà incroyable de voir à quel point les systèmes, en particulier celui de Google, sont capables de traduire ce que nous disons à la volée, mais la quasi-totalité d’entre eux parlent à l’aide de leurs propres voix, évidemment synthétisées. Que ressentiriez-vous si vous vous entendiez parler une autre langue que vous connaissez à peine? C’est l’avenir magique et presque inquiétant que Google Traduction pourrait offrir grâce à Translatotron.
Translatotron n’est pas un nouveau personnage de Transformers. C’est juste le surnom que les chercheurs en intelligence artificielle de Google ont donné à leur modèle de traduction de parole « de bout en bout ».
Translatotron : un outil permettant de traduire la voix
La capacité de Translatotron à conserver la voix du locuteur source même dans le discours traduit n’est en réalité qu’un effet de la véritable nature du système. La plupart des systèmes de traduction divisent le travail en trois parties. L’un convertit la parole en texte, l’autre prend ce texte et le traduit dans une autre langue, tandis que le troisième le retourne en parole, souvent d’une voix différente de celle du locuteur d’origine.
Ce système en cascade s’est avéré efficace et pratique et constitue le moteur de la plupart des systèmes de traduction, y compris ceux de Google. Les chercheurs en intelligence artificielle de Google estiment toutefois qu’un système de bout en bout peut en réalité le surpasser en supprimant les intermédiaires. Littéralement, il saute la partie où la parole est d’abord traduite en texte.
Translatotron n’a pas encore dépassé les systèmes en cascade traditionnels dans les tests de l’équipe, mais cela a prouvé que c’était au moins faisable. Comme tout modèle de machine learning, il pourrait s’améliorer avec le temps. Étant donné l’avantage de préserver la voix originale de l’orateur même dans le discours traduit, de nouvelles recherches dans ce domaine pourraient s’avérer utiles pour les futurs systèmes de traduction de Google basés sur l’IA.



