,

Traduction automatique neuronale de textes brevets: 3 outils Patentscope, Espacenet et DeepL

Les moteurs de recherche  Google, Bing, Yahoo, Yandex et Baidu offrent depuis longtemps des outils de traduction en ligne avec des résultats inégalés surtout pour des publications scientifiques ou brevets.

La traduction neuronale utilise l’intelligence artificielle et  à partir d’un grand volume d’exemples déjà traduits affine ses résultats. Cette méthode est utilisée déjà dans 2 bases de données brevets: Patentscope et Espacenet.

Patentscope

Dans ce domaine, il faut saluer le travail effectué depuis 2016 par l’Office Mondial de la Propriété Intellectuelle qui propose un service de traduction automatique neuronale de textes brevets au départ depuis des sources en chinois, coréen ou  japonais vers l’anglais.

Cette technologie fondée sur l’intelligence artificielle repose sur des modèles de réseaux neuronaux  dont l’apprentissage se fait au moyen de phrases préalablement traduites. L’outil permet de traduire depuis l’arabe, l’allemand, le français, le portugais, le russe et les 3 langues asiatiques de départ vers ou depuis l’anglais.

http://patentscope.wipo.int/translate/translate.jsf

L’avantage de l’outil est  sa flexibilité car il  est possible d’intégrer n’importe quel texte même en dehors de texte brevet et de choisir parmi les 32 domaines techniques différents pour une meilleure traduction. L’OMPI ne conserve pas les données sur les textes traduits.

Espacenet

L’office européen des brevets a développé également un outil de traduction automatique neuronale en partenariat avec Google depuis et vers les langues suivantes: allemand, anglais, chinois, coréen, espagnol, français, japonais, portugais et turc. La traduction se fait bien sur les serveurs de l’office mais avec une technologie appartenant à Google.

source:PatentInformation News -Juin 2017

La traduction est directement accessible depuis le texte du brevet via le bouton Patentranslate.

 

DeepL

Un nouvel entrant basé également sur la traduction neuronale a vu le jour : DeepL, une société allemande qui gère déjà le dictionnaire en linge Linguee.  L’outil permet de traduire de et vers les langues suivantes: anglais, allemand, espagnol, français, italien , néerlandais, polonais jusqu’à 5000 mots.

UPDATE: décembre 2018   Le russe et le portugais ont été ajoutées

Même si l’outil n’est pas spécialisé dans les textes brevets, les tests effectués s’annoncent d’ores et déjà prometteurs et offre la possibilité d’améliorer certains mots traduits . De nouvelles langues comme le chinois, le russe ou le japonais sont annoncées pour 2018.

Conclusion

Je privilégie Patentscope jusqu’à présent pour la qualité des résultats de traduction notamment depuis le coréen et le chinois mais DeePL en intégrant  d’autres langues européennes doit également être pris en compte. Le point faible d’Espacenet reste qu’il n’est pas possible d’avoir le texte original et le texte traduit côte à côte afin de vérifier plus facilement la traduction contrairement aux deux autres outils présentés.

Le choix de tel ou tel outil se fera aussi cependant en fonction de la langue du texte original, l’arabe, le russe n’étant pas exemple disponible que sur Patentscope.