El nuevo estándar de Internet: las búsquedas por voz

Jorge A. Hernández

6 años ago

Para finales de 2019 Google estimaba que el 20% de las búsquedas que se realizaban en su app, se hacían a través de la voz, una cifra que subiría al 50% en este año. Las búsquedas por voz son el futuro de la red.

Los clientes siempre buscan la facilidad de uso y las búsquedas en Internet a través de la voz hacen exactamente eso, simplifican los procesos ahorrando la necesidad de escribir.

Razones como esta han hecho crecer el segmento de búsquedas a través de la voz de modo que se estima lleguen a mover más de 31.820 millones de dólares para 2025.

Este crecimiento ha originado que las páginas web estén cada día más optimizadas para ser consultadas por búsquedas de voz. ¿Pero cómo lo hacen?

La respuesta está en la inteligencia artificial

La búsqueda por voz es una tecnología basada en el reconocimiento de la misma voz, una tecnología usada hace años por asistentes digitales como Siri, Alexa, Aura, Google, Cortana, etc.

Aunque se viene trabajando en reconocimiento de voz desde mediados del siglo pasado los computadores de esa época no eran tan potentes y hoy todavía sigue siendo una labor muy exigente.

Por ello, los asistentes digitales no procesan la voz en los teléfonos o parlantes, en su lugar la envían a la nube. De esta forma, el procesamiento de voz desde asistentes como Siri o Google es realizado por distantes computadoras, ubicadas en gigantescos centros de datos.

Pero este procesamiento va más allá del hardware, los sistemas de reconocimiento como el de Google trabajan a través de redes neuronales que imitan el comportamiento humano y no solo reconocen una palabra por el sonido, también por el contexto de las otras palabras empleadas en un mismo mensaje.

Trabajando por capas

Los sistemas de reconocimiento de voz son complejos y dividen su operación en varias capas cada una de las cuales tiene una función como establecer el origen del sonido (es de un televisor, radio, un usuario), idioma del hablante, la parte semántica (el significado de lo que dice), etc.

Otro aspecto sobresaliente de los sistemas de reconocimiento es que aprenden de sus usuarios, para cada día ser más acertados, y así reconocer lo que digan sus usuarios sin importar el acento.

El reconocimiento por voz además está evolucionando y empezando a realizar traducciones simultáneas entre distintos idiomas abriendo una puerta gigantesca para el turismo y los negocios.

Foto creada por master1305 – www.freepik.es