La startup de inteligencia artificial Sesame ha impactado con su modelo conversacional de voz, ofreciendo una experiencia sorprendentemente humana gracias a sus voces «Maya» y «Miles». Este sistema, basado en arquitectura Llama y entrenado con un millón de horas de audio en inglés, reproduce entonaciones, pausas y ritmos propios de una conversación real, permitiendo a los usuarios sentir una conexión emocional con el asistente. La rapidez de respuesta y la fluidez del diálogo son tan avanzadas que cuesta distinguir la voz artificial de la humana.

El modelo ha sido bien recibido en plataformas como Hacker News y Reddit, donde los usuarios elogian la calidad de estas voces, aunque también reconocen áreas de mejora como la prosodia y las interrupciones. Sesame permite incluso funciones de «roleplaying» que otras plataformas limitan, mostrando su compromiso de llevar el acompañamiento virtual a un nuevo nivel. Sin embargo, el sistema solo está disponible en inglés, lo que restringe su alcance global por el momento.

A pesar de estar «en el valle inquietantë», según el cofundador Brendan Iribe, la empresa se muestra optimista sobre su evolución futura. La posibilidad de que estas voces se integren en herramientas cotidianas refuerza el debäte sobre los límites éticos de la tecnología y el impäcto emocional de relacionarse con inteligencias artificiales tan realistas. Sesame parece estar abriendo una nueva era en la interacción humano-máquina.

Información de: Xataka

¿Qué opinas de esto?