Microsoft ha logrado un gran avance en el reconocimiento de voz, creando una tecnología que logra identificar las palabras al mismo nivel que lo haría una persona.

Un grupo de investigadores e ingenieros del grupo de Investigación e Inteligencia Artificial de Microsoft crearon un sistema que tiene el mismo margen de error que personas que se dedican a transcribir dictados. Este margen de error es del 5.9%, bajando el 6.3% que lograron el mes pasado.

Igual que un humano

Este 5.9% es similar al que alcanzaron personas que se les pidió que transcribieran una conversación de prueba y actualmente es el nivel mas bajo que se ha alcanzado en la industria.

«Hemos alcanzado la paridad humana», dijo Xuedong Huang, el jefe científico del habla en Microsoft, «Es un logro histórico».

Todo esto significa que por primera vez una computadora logra reconocer las palabras en una conversación tan bien como lo haría una persona.

Aunque todavía hay trabajo por hacer, ya que finalmente este reconocimiento solo equipara a la capacidad humana, pero no implica un reconocimiento perfecto. Además de que estas pruebas se realizan en un ambiente controlado por lo que tiene que afinarse esta tecnología para que sea capaz de enfrentarse a lugares con ruidos ajenos a nuestra voz.

Tampoco hay que perder de vista que este es solo el primer paso, por que hay seguir trabajando en que verdaderamente entienda el significado que le damos a nuestras palabras.

¿Que nos espera para el futuro?

Hace años el reconocimiento de voz se había ocupado principalmente para transcribir dictados a nuestra computadora, pero con el auge de los telefonos ingeligentes se empieza a hacer mas uso de esta tecnología con los asistentes virtuales que vienen integrados en ellos tal como Siri y Cortana.

De hecho para Google es una de las cartas fuertes ahora que lanzó Pixel, ya que muchas de las novedades que brinda su telefono son gracias al desarrollo de este tipo de tecnología de reconocimiento de voz.

Poco a poco empezaremos a ver en mas dispositivos a los que les podremos dar instrucciones ocupando el lenguaje natural en nuestro día a día, que sin duda nos ayudarán a realizar nuestras tareas de una manera mas cómoda y eficiente al tener un asistente virtual que nos acompañe a donde vayamos, así como podemos ver a JARVIS en las películas de Ironman.