Comment fonctionne Skype Translator

Table des matières:
- La technologie qui rend cela possible
- Passer d'une langue parlée à une autre en quelques secondes
- Le programme de test comme point de départ
La science-fiction regorge de références à des dispositifs technologiquement avancés dont le fonctionnement, pour paraphraser l'expression mythique, est indiscernable de la magie. Issus de l'esprit créatif de leurs auteurs, il est difficile d'imaginer quand de telles inventions pourraient être entre nos mains et nous finissons par accepter que leur existence ne fera pas partie de notre cycle de vie. Mais de temps en temps, l'un d'eux se faufile prématurément dans nos vies. C'est le cas de la traduction en temps réel que Microsoft et Skype sont sur le point de rendre possible
"La tâche est tout sauf simple.Cela implique la capacité de Skype à effectuer des vidéoconférences, le vaste réseau de serveurs cloud de Microsoft Azure, les innovations technologiques de Microsoft Research et les avancées récentes dans de multiples domaines tels que les statistiques et l&39;apprentissage automatique. Tout cela mis à votre service pour que, dès que vous prononcez une phrase dans votre langue, le système reconnaisse ce que vous dites, le traduise et le transmette à votre interlocuteur dans une autre langue. Comment est-ce possible?"
La technologie qui rend cela possible
Skype Translator, le nom sous lequel la nouvelle fonctionnalité est connue, n'est pas un feu de paille, pas même en un an . Skype Translator est le résultat de décennies de recherche sur la reconnaissance vocale, la traduction automatique et les techniques d'apprentissage automatique. Dans tous ces domaines repose le fonctionnement d'un système qui n'aurait pas été possible sans les dernières avancées en la matière.
Skype Translator est le résultat de décennies de recherche dans les techniques de reconnaissance vocale, de traduction automatique et d'apprentissage automatique.Commencer par Reconnaissance vocale, une technologie à l'étude depuis un certain temps mais dont l'adoption a toujours été affectée par le grand nombre d'erreurs et la sensibilité excessive des systèmes existants. Une seconde de doute, de petites variations d'accent, ou un minimum de bruit suffisaient pour embrouiller l'ordinateur et lui faire comprendre ce qu'il voulait. C'était comme ça jusqu'à ce que le développement des techniques de « deep learning » et la création de réseaux de neurones artificiels explosent, dont Microsoft Research sait quelque chose. Grâce à eux, il a été possible de réduire considérablement le taux d'erreur et d'améliorer la fiabilité et la robustesse de la reconnaissance vocale, première étape nécessaire au fonctionnement de Skype Translator.
traduction automatique est l'autre pilier évident sur lequel repose Skype Translator. Ici, Microsoft utilise à nouveau une technologie interne et utilise le moteur de traduction Bing pour traduire du texte d'une langue à une autre.Son système utilise une combinaison de techniques de reconnaissance de syntaxe et de modèles statistiques pour affiner le résultat. De plus, à cette occasion, le moteur a été spécialement formé pour reconnaître le type de langage qui se produit dans les conversations parlées, loin de l'exactitude et de la netteté généralement supposées à l'écrit. Ainsi, le système Skype Translator combine la vaste base de connaissances linguistiques de Bing Translator avec une vaste couche de mots et de phrases couramment utilisés dans le langage familier.
Mais la parole et les langues sont des terrains compliqués. Ils changent constamment, ils se déclinent en plusieurs saveurs et variétés, chacun a son propre style, etc. Skype Translator doit suivre tout cela, nécessitant une formation et une optimisation constantes de la reconnaissance vocale et de la traduction automatique. Pour ce faire, le système a été construit sur une plate-forme robuste de "machine learning", une branche de l'intelligence artificielle qui vise à développer des techniques permettant aux machines et aux algorithmes d'apprendre en s'entraînant avec des exemples de données.L'utilisation de ces techniques, courantes dans le domaine des statistiques, permet au service de s'améliorer au fur et à mesure de son utilisation, en profitant des données générées lors de son utilisation pour affiner davantage la reconnaissance vocale et la traduction automatique.
Certaines de ces données de test sont générées automatiquement à partir d'une grande variété de sources, y compris des réseaux sociaux tels que Facebook, des pages Web traduites, des vidéos avec sous-titres ou même des conversations créées à cet effet et transcrites et traduites manuellement. . Mais une autre partie des données provient de conversations réelles tenues via le service. Ceci est important car, comme Microsoft vous avertit à chaque appel, vous devez savoir que Skype Translator peut enregistrer les conversations, en les gardant anonymes, afin qu'elles puissent être analysées ultérieurement par ses algorithmes et introduites dans le processus de formation de leurs modèles statistiques.
Skype Translator ne peut fonctionner correctement que s'il est capable d'apprendre à travers un processus basé sur son utilisation dans de vraies conversations humaines
"Le système ne pourrait pas fonctionner sans ce processus d&39;apprentissage. Au fur et à mesure que les humains parlent, nous faisons des pauses et répétons des choses, faisons des erreurs et changeons notre façon de penser au fur et à mesure, en introduisant ahs, ehms, uhms>seul apprendre son utilisation réelle peut l&39;améliorer "
Passer d'une langue parlée à une autre en quelques secondes
Grâce à toutes ces avancées, l'essentiel est que Skype Translator est capable d'exécuter l'intégralité du processus de reconnaissance et de traduction rapidement et de manière transparente pour l'utilisateur Chaque fois que nous parlons, le système doit reconnaître ce que nous disons, le traduire dans la langue du destinataire et le lui communiquer d'une manière qui reste fidèle à ce que nous essayons de communiquer initialement.Moins nous remarquons les étapes intermédiaires, mieux c'est.
Dès que le système détecte que nous parlons, il commence à enregistrer ce que nous disons et démarre le processus de reconnaissance vocale Ce n'est pas non seulement de reconnaître chaque mot que nous prononçons, mais aussi d'éliminer tout ce qui est superflu, en supprimant les expressions sans signification et le bruit, en détectant la division du texte en phrases, avec l'inclusion de signes de ponctuation et de majuscules, et en lui fournissant un contexte cela aide à votre interprétation. Quand on y réfléchit un peu, on se rend compte à quel point il est difficile de déterminer tout cela à partir de la langue parlée.
Skype Translator a besoin que la reconnaissance vocale soit aussi précise que possible, car ce qui suit consiste à préparer les informations collectées pour les comparer aux modèles statistiques qui se sont améliorés grâce à son système de 'machine learning'.Ici, le processus consiste à trouver des similitudes entre ce que le système a compris que nous disions et les mots et contextes contenus dans les modèles, pour ensuite appliquer des transformations apprises précédemment qui convertiront l'audio en texte et le traduiront dans la langue étrangère.
Dans la dernière étape, Skype a préparé une paire de bots, avec des voix féminines et masculines, qui agissent comme interprètes dans l'appel Une fois celui-ci sélectionné par l'utilisateur, il se chargera de communiquer notre message traduit au destinataire, afin que non seulement les transcriptions écrites et les traductions apparaissent à l'écran, mais qu'il puisse également les entendre à haute voix comme si un troisième humain était intermédiaire entre nous. . Ces bots sont capables de communiquer rapidement le message, de sorte que celui qui écoute de l'autre côté de l'écran reçoive le message quelques secondes après que nous l'ayons prononcé.
Le programme de test comme point de départ
Précisément, la présence de bots en tant qu'intervenants tiers dans la conversation est l'un des détails qui reste encore à peaufiner. Microsoft reconnaît que s'y adapter est facile pour les personnes habituées à parler par l'intermédiaire d'un interprète, mais pour d'autres, cela nécessite une période d'apprentissage. Et c'est que Microsoft et Skype sont peut-être déterminés à créer la meilleure expérience de traduction en temps réel qui existe, mais pour ce faire ils ont besoin que nous apprenions à la fois nous-mêmes et les machinesL'aperçu de Skype Translator n'est qu'une étape de plus dans ce processus.
Le programme de test a été lancé à la mi-décembre, introduisant la traduction orale entre deux langues : l'anglais et l'espagnol, et la traduction écrite dans plus de 40 Pour y accéder, une invitation est nécessaire, que nous pouvons demander en nous inscrivant sur le site du programme. Si nous en sommes honorés, nous pouvons essayer Skype Translator à partir des applications Skype pour Windows 8.1 ou aperçu technique de Windows 10. Sinon, nous devrons attendre que le service soit prolongé et rendu public officiellement.
"Quoi qu&39;il en soit, Skype Translator a démarré juste au moment où nous sommes sur le point de dire au revoir à 2014. Avant de terminer, arrêtez-vous ici une seconde et pensez à l&39;année que vous venez de lire : deux mille quatorze>"
Via | Blogues Skype I, II