17 C
Guatemala City
miércoles, julio 2, 2025

La tecnología que reconoce conversaciones tan bien como una persona

- Advertisement -spot_img

Recientemente uno de los equipos de investigación especializada en Inteligencia Artificial de Microsoft logró un avance más que significativo en su tecnología de reconocimiento de voz, al crear una que es capaz de identificar las palabras en una conversación de la misma forma en que lo haría una persona.

Esta tecnología comete la misma cantidad de errores que un transcriptor profesional, es decir, muy pocos. El índice de error en la identificación de palabras es de tan solo 5.1%, que es exactamente igual al que obtuvieron las personas a las que se les solicitó que transcribieran las mismas conversaciones.

“Este es un logro histórico, hemos alcanzado la paridad humana” -Xuedong Huang, Microsoft’s Chief Speech Scientist (Científico en jefe de temas de lenguaje para Microsoft)

 

- Advertisement -

Tantos errores como un ser humano

Este logro significa que por primera vez en la hisotria, una computadora puede reconocer las palabras en una conversación al mismo nivel que los seres humanos. Es decir, que logra igualar la capacidad de los seres humanos, pero que no implica perfección.

Los seres humanos no comprendemos las conversaciones a la perfección, cometemos ciertos errores, sobre todo con palabras cuyo sonido es muy parecido.

El equipo de investigación atribuye este nivel de paridad a el uso sistemático de las tecnologías más recientes sobre redes neuronales.

Entre estas, por ejemplo, el uso de modelos de lenguaje neuronal en los que las palabras están expresadas como vectores continuos en el espacio, por lo que palabras tales como “rápido” y “veloz” están muy cerca la una de la otra.
De esta manera los modelos son capaces de generalizar de forma muy precisa entre palabras.

- Advertisement -

 

Las implicaciones de este nuevo descubrimiento

Es el resultado de décadas de investigación en reconocimiento de lenguaje que empezaron desde la década de los años 70 en una agencia gubernamental de Estados Unidos llamada DARPA, que se dedicaba a realizar investigaciones científicas con fines de defensa del territorio.

Algunos productos de consumo y comerciales podrían ver aumentadas sus capacidades al implementar reconocimiento de voz. Tal es el caso de consolas de videojuegos, herramientas de transcripción por medio de dictado por voz, así como asistentes digitales como es el caso de Cortana de Microsoft.

 

Al momento deben seguir puliendo esta tecnología hasta que funcione en ambientes más reales y no únicamente desde un laboratorio, este es el caso de espacios ruidosos. Dijeron también que uno de los siguientes pasos será identificar y asignar nombres a individuos en conversaciones grupales, asegurándose que funcione correctamente con un amplio rango de voces, sin importar la edad, acento o habilidad para hablar.

En el futuro, cuando la investigación logre ir más allá del simple reconocimiento y transformarse en una herramienta capaz de interpretar las conversaciones, podríamos estar ante el futuro del servicio al cliente efectivo y eficiente. De igual forma, su uso en la investigación de mercados y neuromarketing sería valiosísimo.

Aunque no sabemos exactamente de cuánto tiempo se requerirá para llegar allí, los investigadores siguen trabajando.

Buscar

Recientes

spot_img

No te puedes perder

Los 6 Estímulos del cerebro reptil

Existen algunos estímulos del cerebro reptil que son los...

Neuromarketing y Personal Branding, cómo conquistar a través de los sentidos

Actualmente, la complejidad del Neuromarketing abarca desde el desarrollo...

¿Qué información genera mi imagen?

¿Cómo nos ven los demás? ¿Qué información genera mi...

Promoción para el Neurocamp Latinoamérica, 25 y 26 de Octubre 2018

Estamos a pocos días del Neurocamp Latinoamérica 2018, y...

4 Tendencias de Neuromarketing Digital que veremos en el 2018

¿Neuromarketing digital? Si bien el marketing offline seguirá siendo...

Integrando WhatsApp Business en la Estrategia Digital: Claves para el Éxito Empresarial

En el mundo moderno se encuentra altamente digitalizado y...

¿Qué es la compra programática y por qué toda marca debería considerarla?

¡Entendamos la mente del consumidor! Esto es clave en...

Psicología del precio: El Efecto Búmeran de los Descuentos

¿Qué elementos psicológicos impulsan a las personas a comprar...

10 datos sorprendentes sobre el cerebro humano

Conocemos el cerebro con una definición básica: "uno de los centros nerviosos constitutivos del encéfalo". Sin...

3 tips psicológicos para aumentar las ventas durante el Fin de Año

Durante las fiestas de fin de año, fuimos testigos...
spot_img