OpenAI ha anunciado una actualización significativa para Advanced Voice Mode en ChatGPT, su función de asistente de voz en tiempo real. La mejora está diseñada para hacer que las conversaciones sean más fluidas y naturales, reduciendo las interrupciones y mejorando la personalidad del asistente.
La investigadora Manuka Stratta, experta en post-entrenamiento en OpenAI, reveló los cambios en un video publicado en las redes sociales oficiales de la empresa. Según Stratta, esta actualización responde a una de las principales quejas de los usuarios: la tendencia del asistente de voz a interrumpir cuando detecta pausas en el habla, incluso si el usuario simplemente está tomando un respiro o formulando su siguiente pensamiento.
Ahora, los usuarios gratuitos de ChatGPT pueden disfrutar de un asistente que permite pausas naturales sin interrumpir la conversación. Además, los suscriptores de los planes pagos, como Plus, Teams, Edu, Business y Pro, experimentarán una reducción aún mayor en la frecuencia de interrupciones y una mejora en la personalidad del asistente, haciéndolo más directo, comprometido y creativo en sus respuestas.
Un portavoz de OpenAI declaró a TechCrunch que el nuevo asistente de voz para suscriptores pagos es “más conciso, específico y atractivo en sus interacciones.” Estas mejoras buscan posicionar a OpenAI a la vanguardia en el competitivo mercado de asistentes de voz basados en inteligencia artificial.
La competencia en este sector se ha intensificado en los últimos meses. Recientemente, la startup Sesame, respaldada por Andreessen Horowitz y fundada por Brendan Iribe, cofundador de Oculus, ha ganado notoriedad con sus asistentes de voz Maya y Miles, conocidos por su tono conversacional natural. Asimismo, gigantes tecnológicos como Amazon están impulsando innovaciones en este campo, con el próximo lanzamiento de una versión mejorada de Alexa basada en modelos de lenguaje avanzados (LLM).
Con esta actualización, OpenAI refuerza su compromiso con la mejora continua de la inteligencia artificial conversacional, ofreciendo una experiencia de usuario más inmersiva y natural en ChatGPT.
Fuente: TechCrunch