Google et la reconnaissance vocale : vers la fin des claviers ?
Un nouvel outil développé par Google permet de réduire le temps de latence de la reconnaissance vocale, d’augmenter sa précision mais également de fonctionner en mode hors-ligne. De cette façon, le géant américain pourrait optimiser la reconnaissance vocale sur les smartphones. Assistera t-on à la disparition des claviers ?
En 2012, des recherches dans le domaine de la reconnaissance de la parole ont révélé d'importants progrès issus de machine learning, notamment au niveau de l'utilisation des réseaux neuronaux profonds pour la modélisation acoustique.
Ces recherches ont permis l'adoption de cette fonction dans des produits tels que le moteur de recherche Google, également connu sous le nom de Google Voice Search. Mais ceci n'était que le début d'une petite révolution. En effet, de nouvelles architectures commençaient à apparaître chaque année pour améliorer la technologie de reconnaissance vocales, des réseaux neuronaux profonds (DNN) et récurrents (RNN) aux réseaux neuronaux convolutionnels, pour ne citer que quelques exemples.
L'un des objectifs les plus importants de ces architectures a toujours été de réduire la latence, c'est-à-dire le temps d'attente entre la parole et la reconnaissance. Dans cette optique, Google a annoncé l'introduction d'une nouvelle fonction de reconnaissance neuronale pour faciliter la saisie de texte sur son clavier Gboard. La nouvelle technologie utilise un transducteur de réseau neuronal récurrent (RNN-T), qui élimine la latence et les irrégularités d'exploitation.
Le transducteur est suffisamment compact pour être utilisé dans des appareils mobiles. Ainsi, la technologie passe d’être hébergée sur le serveur à être hébergé sur le smartphone. Cela permet également la reconnaissance vocale hors ligne. Le modèle amène la transcription au niveau du phonème/caractère, de sorte que le clavier tape les caractères au fur et à mesure que l'utilisateur parle, comme s'il parlait et écrivait en même temps.
La nouvelle reconnaissance vocale pour le clavier Gboard devrait être disponible pour tous les smartphone Pixel. Toutefois, pour le moment, seuls les Pixels utilisant la langue anglaise (US) recevront la mise à jour. Etant donné les améliorations algorithmiques actuelles, on s'attend à ce que la fonction soit disponible dans d'autres langues très prochainement.
Que pensez-vous de cette nouvelle avancée dans le domaine de la reconnaissance vocale ? Pouvez-vous imaginer un avenir proche où les claviers deviendraient obsolètes ?
Source : Google AI Blog
On y est pas encore.
Avez-vous déjà essayé d'envoyer un sms ou mail avec Google assistant?
Moi, j'ai l'impression que c'est plus lent, qu'il a du mal a trouver le bon destinataire. Sans compter le temps passé à corriger les fautes d'orthographe, à se faire comprendre à cause d'une prononciation approximative.