Controlar tu hogar inteligente con la voz ya no es algo exclusivo de asistentes como Alexa o el asistente de Google. Si usas Home Assistant, tienes acceso a un sistema mucho más flexible y personalizable que te permite definir exactamente cómo interactúas con tus dispositivos, sin depender completamente de servicios externos. Sin embargo, esta libertad también implica una mayor complejidad inicial, especialmente si no sabes por dónde empezar. Ahí aparece el problema para muchos usuarios que quieren usar asistentes de voz para Home Assistant, pero no tienen claro qué opciones existen ni cuál elegir. ¿Es mejor usar la nube o un sistema local? ¿Qué herramientas necesitas? En este artículo, te explicamos de forma clara cómo configurar el asistente de voz nativo de Home Assistant y qué alternativas tienes según tu nivel técnico y tus necesidades.
Puntos Clave:
- Home Assistant incluye su propio asistente de voz llamado Assist, que puedes usar tanto en local como con servicios en la nube según tu configuración.
- Puedes crear un pipeline de voz completamente personalizado combinando herramientas como Whisper y Piper para transcripción y síntesis sin depender de internet.
Tabla de Contenidos
Aquí te contamos cómo configurar el control por voz en Home Assistant paso a paso, qué opciones tienes y cuál se adapta mejor a tu entorno.
Qué es Assist y cómo funciona en Home Assistant para usar comandos de voz en tu proyecto de domótica
Assist es el asistente de voz integrado en Home Assistant. Te permite controlar dispositivos, ejecutar automatizaciones y consultar información usando lenguaje natural. A diferencia de otras soluciones, no está limitado a un ecosistema cerrado, sino que puedes adaptarlo completamente a tus ajustes.
El sistema funciona mediante un pipeline de voz compuesto por tres partes: reconocimiento de voz, procesamiento del comando y respuesta. Puedes usar opciones locales, servicios en la nube o una combinación de ambos.
Para empezar a usar Assist:
-
Abre la plataforma de Home Assistant en tu móvil.
-
Accede al panel principal y pulsa el icono de Assist en la parte superior.
-
Prueba comandos básicos como encender luces o consultar estados.
Esta es la forma más rápida de comprobar cómo funciona sin configurar nada adicional.
Cómo configurar Assist en la nube con Home Assistant Cloud
Si buscas una configuración rápida y sin complicaciones, Home Assistant Cloud es la opción recomendada. Este servicio gestiona automáticamente el reconocimiento y la síntesis de voz, además de facilitar la integración con asistentes externos.
Con esta opción, no necesitas instalar componentes adicionales ni preocuparte por el rendimiento del hardware. Ten en cuenta que necesitas una suscripción a Home Assistant Cloud (Nabu Casa).
Estos son los pasos para configurarlo:
-
Abre Home Assistant y dirígete a Configuración > Asistentes de voz.
-
Pulsa el botón “Añadir asistente”.
-
Selecciona los servicios de "voz a texto" y "texto a voz" de la nube.
-
Prueba las diferentes voces e idiomas disponibles para personalizar la respuesta.
Esta alternativa permite configurar rápidamente el asistente de voz y es la mejor opción si quieres integrarlo de forma sencilla con Alexa y Google Assistant, pero la desventaja es que dependes de internet y de un servicio de pago.
Cómo crear e integrar un asistente de voz local con Whisper y Piper
Si prefieres mantener el control total y evitar depender de la nube, puedes montar un pipeline de voz completamente local. Esta opción utiliza herramientas de código abierto que se ejecutan directamente en tu red.
Whisper se encarga de convertir la voz en texto, mientras que Piper genera la respuesta hablada. Ambas herramientas funcionan como complementos dentro de Home Assistant.
Pasos para configurarlo:
-
Abre Home Assistant y ve a Configuración > Aplicaciones.
.png)
-
Selecciona “Instalar aplicación”, en la esquina inferior derecha.
.png)
-
Busca la extensión “Whisper” con la barra de búsqueda
.png)
-
Procede a su inslación haciendo clic en “Instalar”.
.png)
-
Activa la opción “Iniciar en el arranque” y pulsa el botón “Iniciar”.
.png)
-
Usando en la tienda el termino de busqueda: Whisper tendrás que seleccionar el add-on: Whisper.cpp
.png)
-
Procede a su instalación.
.png)
-
No te olvides de Inciarlo.
.png)
-
Ahora busca e instala el add-on “Piper”.
.png)
-
Instala la aplicación Piper.
.png)
-
Activa el inicio en el arranque e inicia la extensión.
.png)
-
Abre la pestaña de “Configuración” desde el menú superior.
-
Selecciona una de las voces en el menú desplegable.
-
Y haz clic en el botón Guardar
.png)
-
Luego dirígete a Configuración> Dispositivos y servicios
.png)
-
Aquí haz clic en Añadir en las integraciones descubiertas: Piper Wyoming Protocol y Whisper Wyoming Protocol
.png)
-
En el recuadro mostrado en cada uno de ellos, haz clic en el botón: Enviar
.png)
-
Dirígete a Configuración > Asistentes de voz.
.png)
-
Añade un nuevo asistente o selecciona el que está configurado por defecto para editarlo.
-
En el menú desplegable de “Voz-a-Texto”, selecciona Whisper.
.png)
-
En “Texto-a-Voz”, selecciona Piper.
-
Guarda los cambios.
.png)
Este sistema puede funcionar sin conexión a internet y ofrece tiempos de respuesta muy rápidos, incluso en hardware modesto. Además, puedes elegir entre diferentes voces o incluso crear una personalizada, aunque para ello tendrás que acceder a los ajustes avanzados.
Cómo elegir el motor de conversación: local o basado en IA
El siguiente componente clave es el “conversation agent”, es decir, el sistema que interpreta lo que dices y decide cómo responder.
Tienes varias opciones:
-
Usar el agente nativo de Home Assistant (ideal para control básico).
-
Integrar un modelo de lenguaje local (más privacidad).
-
Conectar un servicio en la nube como ChatGPT para respuestas avanzadas.
Puedes ajustarlo desde Configuración > Asistentes de voz. Desde allí tienes la opción de probar comandos y ajustarlo según el resultado. Recuerda que los modelos más avanzados ofrecen mayor flexibilidad, pero también requieren más recursos o conexión a internet.
Conclusiones personales
El asistente nativo de Home Assistant destaca por algo que pocas alternativas ofrecen, esto es, control total. Puedes decidir si quieres priorizar comodidad con la nube o privacidad con un sistema completamente local en tu servidor, ya sea en un PC o en dispositivos dedicados. Además, es posible integrar tecnologías como STT y TTS para gestionar el audio desde un micrófono hasta un altavoz, lo que permite controlar nuestro hogar con mayor precisión y fiabilidad.
Está claro que no se trata de una solución automática al nivel de otros asistentes comerciales como Amazon Alexa o Google Home, y en muchos casos requiere tiempo, pruebas y cierto conocimiento técnico para instalarlo y sacarle el máximo partido.
Dicho esto, los resultados valen la pena, ya que obtienes un sistema mucho más flexible y potente, capaz de adaptarse a tu entorno y gestionar acciones como activar una palabra de activación, ejecutar un temporizador o interactuar con cada entidad desde tu app.