¿Altavoces inteligentes o escuchas inteligentes?

El nuevo HomePod de Apple, el Echo de Amazon y el Home de Google son considerados los mejores altavoces inteligentes del mercado, estos altavoces son capaces de controlar la domótica de tu casa de una forma muy efectiva, pero ¿podemos confiar plenamente en que no nos están espiando? es cuando escuchan lo que marca la diferencia.

Los altavoces inteligentes son el tema de moda en estos días, pero en realidad son un tipo de dispositivo de escucha inteligentes como cualquier otro. En las películas de ciencia ficción con ordenadores activados por voz, como Jarvis en las películas de Iron Man, sólo funcionan si los dispositivos de escucha y los altavoces están disponibles en todas partes. Lo que nos falta es un montón de HomePods de Apple, Amazon Echos, Cortana de Microsoft / Harman Kardon, y altavoces inteligentes de Google Home que estén por toda la casa de Tony Stark. Por supuesto,  cuando tienes tanto dinero como Tony Stark lo más probable es que escondas todos estos dispositivos por las paredes de la casa a la hora de la construcción.

El HomePod de Apple se une a Google Home para enfrentarse al número uno del momento, los altavoces inteligentes Amazon Echo. Todos estos son dispositivos relativamente simples, aunque bien diseñados, que consisten en un SoC inalámbrico que acciona uno o dos altavoces y está conectado a una gran cantidad de micrófonos… «para oírte mejor, querida».

El HomePod de Apple, el Echo de Amazon , el Cortana de Microsoft / Harman Kardon, y los altavoces inteligentes de Google Home son los lideres que están forjando la base para el futuro del mundo de los altavoces inteligentes.

Estos dispositivos pueden actuar simplemente como altavoces inalámbricos que transmiten audio desde distintas fuentes como tu teléfono inteligente, tu tablet, tu ordenador personal o tu portátil. Tienden a tener controles limitados que requieren un smartphone para el control remoto, aunque cada vez más se están controlando únicamente por voz.

Mucho más que simples altavoces

Para muchos de estos últimos, un enlace a internet está en la mezcla, ya que son dispositivos de Internet de las Cosas (IoT) diseñados para hacer todo tipo de cosas no solo reproducir música. Su funcionalidad se extiende a ser un centro de control para el hogar, así como una plataforma para ordenar productos y servicios . También pueden hacer cosas útiles como buscar información en Internet para saber el tiempo del día, o añadir eventos a su calendario.

Mucha de esta magia ocurre en la nube, lo que significa que si la conexión a Internet no funciona o es de naturaleza transitoria, las capacidades de estas plataformas se verán disminuidas. Esto hace que su idoneidad sea sospechosa en algunos entornos con una conectividad más limitada, pero si en tu casa cuentas con un repetidor wifi no . Los entornos de alta latencia también pueden hacer que la interacción sea un desafío.

Aún así, las plataformas son más que micros de gama baja que sólo transmiten información de audio en cualquier dirección. Por lo general, están equipadas con hardware y software robustos y multimicrófonos diseñados para mejorar el soporte de respuesta de voz interactiva (IVR), así como la capacidad de diferenciar entre varias personas que hablan y su ubicación con respecto al dispositivo, habilidad que debemos mencionar esta mejorando a una velocidad increible.

Una de las razones para hacer gran parte del trabajo pesado en la nube es el uso de herramientas como la inteligencia artificial (AI), el aprendizaje automático y el soporte de la red neuronal profunda (DNN). Funcionan mejor con más potencia de cálculo e incluso con hardware especializado de IA y DNN.

Hazlo tú mismo DIY

Los desarrolladores pueden apuntar a estas plataformas para una variedad de puntos de vista. Es posible construir tu propia versión de estas plataformas. Esto permite que el soporte de IVR se incorpore en dispositivos que van desde refrigeradores, enchufes, termostatos y asi un largo  hasta televisores. Hay dos razones para seguir esta ruta. Primero, proporciona una forma de controlar el dispositivo. Segundo, permite reemplazar o complementar el dispositivo, ya que normalmente sólo se puede cubrir una habitación. Amazon incluso da un descuento por cantidad cuando se compran varios Echo Dots .

El altavoz inteligente es sólo parte de un entorno de IO que también puede incluir la compra y entrega de productos y servicios, como por ejemplo hacer un pedido de una pizza a tu sitio favorito solo usando la voz con tu alexa.

Parte del desafío es proporcionar soporte de audio para que el dispositivo funcione correctamente, lo que ha hecho que el procesamiento de audio sea un tema tan candente. Otro desafío es la coordinación con otros dispositivos del entorno. Inicialmente, un solo dispositivo se encontrará en un hogar o una oficina, pero en el futuro la norma será que haya varios dispositivos con cobertura superpuesta. Uno no querría que se hicieran dos órdenes idénticas sólo porque la petición fuera escuchada por más de un dispositivo. Del mismo modo, la itinerancia similar al Wi-Fi, pero en una escala de audio, es algo que puede ser posible en el futuro.

Los desarrolladores de software pueden crear aplicaciones tambien llamadas skills para estos altavoces que funcionen con Siri, Alexa, Google Assistant y Cortana. Este soporte puede ser usado para llevar servicios de voz a hardware nuevo o existente. Estos pueden estar asociados con el altavoz inteligente a través de la LAN o Internet.

La pregunta principal para los desarrolladores es: «¿Qué plataforma, y cuántas plataformas, soporto?» Eso es porque son esencialmente jardines amurallados exclusivos, y puede ser un reto para los desarrolladores de hardware soportar una o más plataformas, actualmente la mayoria de los desarrolladores optan por las skill de alexa ya que siendo el altavoz más popular cuanta con muchos más usuarios activos que el resto.

¿Habrá una quinta plataforma en el futuro? Eso está por verse, pero será una dura batalla con los cuatro pesos pesados que ya están en la mezcla. Se necesitan bastantes servicios para competir en esta área, no sólo reconocimiento de voz y un servicio en la nube.

Deja un comentario