Google avanza hacia un futuro donde los usuarios dejarán de controlar directamente sus teléfonos móviles desde la pantalla, delegando esa función a su sistema de inteligencia artificial, Gemini. Esta apuesta representa un cambio radical en la forma en que se interactúa con los dispositivos Android, abriendo la puerta a una nueva era de automatización en la que las acciones cotidianas dejarán de depender de la intervención manual.
La compañía presentó públicamente las primeras pinceladas de este plan bajo el nombre de Project Astra, en su última conferencia de desarrolladores. Allí, mostró cómo Gemini puede actuar como un agente autónomo, capaz de ejecutar tareas en el teléfono, analizar el contenido en pantalla e incluso desplazarse y activar botones dentro de aplicaciones, sin que el usuario tenga que tocar la pantalla.
En las versiones beta más recientes de la aplicación de Google para Android, los desarrolladores han encontrado nuevas cadenas de código que confirman la inminente llegada de una funcionalidad bautizada como “screen automation”. El nombre en clave interno para el sistema es “bonobo”. Esta herramienta permitirá a Gemini realizar acciones dentro de aplicaciones específicas: desde hacer pedidos en línea hasta solicitar un viaje en apps como Uber o Lyft, todo sin la necesidad de que el usuario interactúe físicamente con su móvil.
El propósito detrás de esta automatización es claro: liberar al usuario de las tareas repetitivas o simples que consumen tiempo, permitiendo que la inteligencia artificial asuma el control operativo bajo una supervisión constante. Según lo demostrado en Project Astra, Gemini no solo es capaz de leer la información que se muestra en pantalla, sino que también puede desplazarse por interfaces, identificar y seleccionar opciones, y confirmar acciones de forma autónoma.
Por ejemplo, el usuario podrá pedirle a la IA que compre un producto en línea o reserve un viaje. La inteligencia artificial analizará la pantalla, detectará los elementos necesarios y procederá a realizar los pasos requeridos, desde el inicio del proceso hasta la confirmación final, sin que el usuario deba tocar la pantalla. A futuro, Gemini podría gestionar desde el seguimiento de compras y pedidos hasta la organización de actividades personales, todo ello a través de una interfaz conversacional y proactiva.
Con información de: La Razón









