La precisión del sistema de reconocimiento por voz de Microsoft supera a la del ser humano

La precisión del sistema de reconocimiento por voz de Microsoft supera a la del ser humano

David Onieva

La importancia de los sistemas de reconocimiento por voz están adquiriendo una gran trascendencia en estos últimos años, algo de lo que las grandes firmas tecnológicas actuales son plenamente conscientes, de ahí los esfuerzos que muchas de estas están poniendo para mejorar y potenciar el uso de sus métodos.

Como seguramente muchos ya os habréis dado cuenta, cada vez está más extendida a costumbre de, en determinadas ocasiones, comunicarnos con nuestros dispositivos, ya sea un PC, móvil, asistente, por medio de la voz. Esto es algo que poco a poco se ha ido haciendo más habitual, con un mayor número de funciones válidas para estas «órdenes» y que, como todo hace indicar, va a continuar creciendo. Por lo tanto una de las compañías que más interés tiene en todo ello, Microsoft, acaba de lograr un objetivo que llevaba persiguiendo hace casi 25 años en el campo del reconocimiento de la voz.

Y es que claro, hay que tener en cuenta que los de Redmond disponen del sistema operativo de escritorio más extendido del mundo, y difícilmente van a perder ese puesto en los años venideros. Es por ello que desde hace tiempo están trabajando en esta tecnología con el fin de que los millones de usuarios de su software puedan aprovecharla al máximo, tanto en Windows como en otras aplicaciones y servicios asociados. Por lo tanto Microsoft se ha marcado como objetivo lograr tener el sistema de reconocimiento por voz más preciso de los existentes, logro que por el momento están logrando.

Microsoft logran el récord de precisión en el reconocimiento por voz

Para el desarrollo de todo ello están empleando una red neuronal bidireccional para conseguir reducir el índice de precisión que mide este apartado, que no es otro que el WER o Tasa de Palabras Erróneas.

Reconocimiento por voz Microsoft

Pues bien, mientras que el pasado año los propietarios de Windows llegaron a contar con una tasa del 6,3%, en tan solo un año han logrado reducirla nada más y nada menos que un 1,2%, logrando así el 5,1% de tasa WER, récord hasta la fecha que supera el anterior 5,9% y que ya también supera a la del ser humano.

Del mismo modo esta importante reducción de la tasa de error en el sistema de reconocimiento de voz de los de Redmond ha venido dada por las mejoras que se han conseguido por medio de los procesos de entrenamiento del método a través de la Nube. Con todo y con ello, no cabe duda de que estos sistemas de reconocimiento por voz van a seguir mejorando con el paso del tiempo, ya que se espera que formen parte importante del modo en el que en el futuro interactuaremos con nuestros dispositivos tecnológicos. Para todo ello tanto los desarrollos a nivel hardware como software no van a cesar, por lo que aún nos esperan muchas sorpresas en este sentido.

¡Sé el primero en comentar!