Gemini Robotics: el salto de Google hacia la robótica inteligente

Una vez más, Google, de la mano de su laboratorio DeepMind, sigue impulsando el futuro de la inteligencia artificial y la robótica con Gemini Robotics y Gemini Robotics-ER, dos proyectos innovadores que integran las capacidades más avanzadas de Gemini 2.0 en robots interactivos, hábiles y de propósito general.

Gemini Robotics utiliza una combinación avanzada de visión, lenguaje y acción para permitir que los robots operen en entornos dinámicos y reales, donde deben adaptarse de forma inmediata a instrucciones cambiantes y nuevas situaciones. Estos robots no solo reaccionan, sino que razonan y generalizan, incluso frente a tareas que nunca han visto antes.

Según Google, para que los robots sean verdaderamente útiles deben cumplir con tres cualidades esenciales: ser interactivos, generales y hábiles.

Interactividad en tiempo real

Una de las principales características de Gemini Robotics es su capacidad para interactuar intuitivamente con las personas y adaptarse continuamente al entorno. Al estar basado en Gemini 2.0, estos robots entienden y responden de forma fluida al lenguaje cotidiano, detectan cambios en su entorno y ajustan sus acciones en tiempo real. Por ejemplo, si un objeto cambia de lugar o el robot recibe una nueva instrucción, la respuesta es inmediata, permitiendo una colaboración efectiva y natural.

Robots de propósito general

Gemini Robotics destaca especialmente por su capacidad para generalizar, es decir, para resolver tareas nuevas aprovechando su comprensión avanzada del mundo físico proporcionada por Gemini 2.0. Un ejemplo concreto mostrado por Google es cuando un robot recibe la orden de hacer coincidir el número de dos dados, tarea que realiza con precisión, no mediante movimientos predefinidos, sino razonando sobre cómo manipular el objeto en tiempo real. Esta capacidad de generalización va incluso más allá, permitiendo al robot ejecutar acciones inéditas como “levantar un balón de baloncesto y hacer un mate”, usando conceptos abstractos aprendidos como referencia.

Destreza para tareas complejas y razonamiento espacial avanzado

Finalmente, Google ha enfatizado que uno de los grandes retos en robótica es dotar a los robots de la destreza necesaria para ejecutar tareas manuales complejas con precisión. Gemini Robotics y especialmente Gemini Robotics-ER enfrentan este desafío demostrando habilidades impresionantes, como doblar origamis o empacar cuidadosamente alimentos, tareas cotidianas aparentemente sencillas para los humanos, pero que requieren un control motor fino extremadamente avanzado y un razonamiento espacial profundo.

Google asegura que Gemini Robotics representa un avance significativo en comparación con modelos anteriores, duplicando en promedio el rendimiento en evaluaciones de tareas de visión, lenguaje y acción. Además, está colaborando con compañías destacadas como Apptronik, Agile Robots, Agility Robotics, Boston Dynamics y Enchanted Tools para desarrollar y validar la nueva generación de robots inteligentes.

Gemini Robotics-ER sobresale en capacidades de razonamiento encarnado, incluyendo la detección de objetos y la señalización de partes de objetos, la búsqueda de puntos correspondientes y la detección de objetos en 3D.

Colaboraciones estratégicas y avances futuros

Google está colaborando con compañías destacadas como Apptronik, Agile Robots, Agility Robotics, Boston Dynamics y Enchanted Tools para desarrollar y validar la nueva generación de robots inteligentes. Estas alianzas buscan acelerar la integración de Gemini Robotics en diversas plataformas robóticas, desde brazos industriales hasta robots humanoides, ampliando su aplicabilidad en múltiples sectores.

Compromiso con la seguridad y la ética

Google DeepMind enfatiza la importancia de la seguridad en el desarrollo de estas tecnologías. Los modelos de Gemini Robotics están diseñados para evaluar la seguridad de una acción antes de ejecutarla, garantizando que las operaciones realizadas por los robots sean seguras y beneficiosas para los humanos. Además, se han implementado marcos de seguridad para identificar y mitigar posibles comportamientos peligrosos en sistemas de inteligencia artificial avanzados.

Con esta nueva generación de robots inteligentes, Google busca transformar la interacción entre humanos y máquinas, acercando la robótica de propósito general a nuestra vida cotidiana, ya sea en hogares o en entornos laborales, de forma efectiva y segura.

Fuente: