Skip to main content

Le service de traduction de Google s’améliore dans la qualité générale de ses traductions grâce à l’utilisation d’un système de réseau neuronal.

Google a commencé à déployer sa principale mise à jour de machine learning pour son outil Traduction, a annoncé la société mardi soir. La mise à jour signifie passer de sa traduction PMT à une traduction NMT, qui, comme on peut s’y attendre, est supposée produire des traductions plus précises. Les résultats seraient plus naturels avec la syntaxe et la grammaire qui reflète mieux la façon dont les gens parlent réellement.

«En 10 ans, Google Translate est passé de la prise en charge de quelques langues à 103, en connectant des étrangers, en franchissant les barrières linguistiques et même en aidant les gens à trouver l’amour», a écrit Barak Turovsky, chef de produit de Google Translate, dans un billet de blog.

Le changement vers le NMT a été annoncé pour la première fois en septembre et visera initialement neuf langues: l’anglais, le français, l’espagnol, le chinois (Mandarin), l’allemand, le turc, le portugais, le japonais et le coréen, Dans la recherche Google, dans l’application Google Traduction et au sein d’un site Web.

Parfois, les langues sont plus faciles à traduire dans une autre langue que l’autre, ce qui signifie que la traduction NMT devra construire un référentiel de données exclusives à une paire (ex : Anglais → Français et Français → Anglais). Google n’a pas mentionné les huit paires que le système allait commencer à prendre en compte et quand les autres parmi ces neuf langues pourraient être entièrement intégrées et utilisées.

Si vous essayez d’avoir une idée des langues qui seront probablement les prochaines sur la liste, attendez-vous à ce qu’il s’agisse des langues les plus communes dans le monde: l’Arabe (standard), le Vietnamien, l’Italien et le Thaïlandais. Les langues indiennes seront certainement proposées toutes ensembles pour s’assurer que les utilisateurs indiens de Google les obtiennent en même temps, à savoir l’Hindi, le Bengali, le Punjabi, l’Ourdou, et le Marathi.

Il serait intéressant de voir si l’utilisation d’une intelligence artificielle par Google permettrait de mieux rassembler des échantillons de langues provenant de langues informelles mais largement parlées. Plusieurs langues chinoises comme le Wu et le Shanghaïen que Pékin n’a pas reconnu dans sa politique nationale d’éducation. Certaines langues indiennes sont également absentes de Traduction, qui sont largement parlées dans les régions sous-connectées du pays.