Google celebraba este martes su esperado evento de lanzamiento de los nuevos teléfonos Pixel y el resto de su ecosistema, unos auriculares y un smartwatch. Aunque los dispositivos no fueron sorpresa para nadie dadas las muchísimas filtraciones previas, la compañía de Mountain View consiguió sorprender con las funciones de inteligencia artificial que integrarán.
Entre ellas, una de las más deseadas era el nuevo modo de chat de voz para Gemini, llamado Gemini Live. Esta futurista funcionalidad se dejó ver en la conferencia anual para desarrolladores de Google el pasado mes de mayo y ahora llega a los dispositivos, pero no a todos.
Tal y como ha explicado Google en su presentación, Gemini Live estará disponible solo para los suscriptores de Gemini Advanced y solo en inglés.
¿Cómo funciona Gemini Live, el nuevo modo de voz con IA de Google?
La novedad que mostró Google este martes funciona de forma muy similar a la función de chat de voz de ChatGPT: podrás hablar con tu móvil de manera natural, como una charla con un amigo.
El modo conversacional permite interrumpir una respuesta a mitad de una frase o pausar el diálogo y volver a él más tarde, todo sin siquiera tener que tocar un botón. Además, Gemini Live también funcionará en segundo plano o cuando tu teléfono esté bloqueado.
Esta IA cuenta con múltiples voces para elegir —10 nuevas— y se diferencia de lo que hasta ahora podíamos hacer en que se trata de un modelo multimodal, es decir, no solo entiende texto, sino también voz, imágenes y, según se ha dicho, vídeo en el futuro.
Un ejemplo: hasta ahora podías pedirle a Google Assistant que te creara una nueva cita en tu calendario para ir al dentista, pero debías dar una orden estructurada para que te entendiera y realizara la tarea; sin embargo, con la nueva IA podrás hablar con tu móvil en lenguaje natural y solicitar este tipo de peticiones como si se tratara de una conversación con un humano.
Otra ventaja es que esta inteligencia artificial comprende el contexto, de manera que es capaz de tener en cuenta la información que las distintas aplicaciones de tu smartphone le pueden proporcionar, como por ejemplo el correo electrónico: “Combinando información de la Web con las herramientas y las apps de Google que ya usas, Gemini puede ayudarte con tareas grandes y pequeñas. Y, a diferencia de otros asistentes, no requiere que cambies entre apps y servicios”, destacan.
Asimismo, dado que puede entender una imagen, podrá también sacar información de un archivo que compartas con ella.
Con el próximo lanzamiento de la extensión de Calendario, explican desde Google, “podrás tomar fotos de un póster, por ejemplo, de un concierto y preguntarle a Gemini si estás libre ese día; incluso podrás establecer un recordatorio para comprar entradas”.
Según la compañía, nuevas extensiones como Keep, Tasks, Utilidades y funciones expandidas en YouTube Music están en camino.
“Por años, hemos confiado en los asistentes digitales para establecer temporizadores, reproducir música y controlar nuestras casas inteligentes. Estas tecnologías facilitaron la realización de tareas y nos ahorraron valiosos minutos todos los días. Ahora, con la IA generativa, podemos brindar un nuevo tipo de ayuda para tareas complejas que pueden ahorrarte horas”, subrayan desde Google.
La novedad ya ha empezado a implementarse en los dispositivos Android, aunque de momento solo está disponible en inglés. Google asegura que llegará a iOS y a más idiomas “en las próximas semanas”.