Apple quiere enseñar a los robots a interactuar y está usando la IA y el Apple Vision Pro

¡Apple es parte de un extenso equipo de investigación que está entrenando robots humanoides utilizando la inteligencia artificia!

Apple quiere enseñar a los robots a interactuar y está usando la IA y el Apple Vision Pro
Apple se mete de lleno en la robótica humanoide
Publicado en Apple

Desde hace años Apple se ha beneficiado de la robótica industrial, aprovechándola en el reciclado de iPhone, con su modelo Daisy o como piensa hacerlo a mediano plazo en el ensamblaje de los nuevos iPhones. Pero ahora, la compañía dirige su mirada hacia la enseñanza de la interacción física a los robots.

Un reciente y revelador artículo de investigación titulado "Humanoid Policy ∼ Human Policy" desvela una colaboración multidisciplinaria liderada por Apple que propone un método innovador para entrenar robots humanoides utilizando la inteligencia artificial y, sorprendentemente, el Apple Vision Pro como herramienta clave de captura de datos.

Apple ya roza la ciencia ficción

Apple quiere enseñar a los robots a interactuar y está usando la IA y el Apple Vision Pro

Los investigadores generaron un método de aprendizaje más eficiente para entrenar a los robots en tareas complejas

El proyecto, que une la experiencia de Apple con el conocimiento académica del MIT, Carnegie Mellon, la Universidad de Washington y la Universidad de California en San Diego, se centra en una pregunta fundamental: ¿cómo dotar a los robots de la capacidad de manipular objetos y desenvolverse en el mundo físico de manera tan natural como lo hacemos los humanos? La respuesta que proponen los investigadores reside en el aprendizaje a partir de la observación en primera persona.

Para alimentar sus modelos de IA, el equipo cumplió con varias etapas:

1.Recopilación de datos PH2D

El equipo de investigación creó un extenso conjunto de datos llamado PH2D. Este conjunto de datos incluyó:

  • Más de 25.000 demostraciones de acciones realizadas por humanos.
  • 1.500 demostraciones de acciones realizadas por robots.

2.Entrenamiento con HAT

  • Los datos PH2D se utilizaron para entrenar una política de Inteligencia Artificial unificada llamada Humanoid Action Transformer (HAT). El objetivo del HAT es controlar robots humanoides reales.

En esta etapa el desafío era superar los problemas del entrenamiento de robots humanoides que tradicionalmente se basa en demostraciones de robots, pero es laboriosa, costosa y difícil de escalar.

3.Recopilación de datos humanos con Apple Vision Pro

Esta fue la alternativa para superar el aprendizaje con demostraciones de robots. Para ello:

  • Desarrollaron una aplicación específica para el Apple Vision Pro que: captura vídeos desde la cámara inferior izquierda del Vision Pro y u tiliza el framework ARKit de Apple para rastrear el movimiento de la cabeza y la mano en 3D con precisión.

4. Exploración de alternativa más asequible:

Para reducir costos, también experimentaron con otra configuración:

  • Utilizaron un soporte impreso en 3D para conectar una cámara estéreo ZED Mini a otros visores (como el Meta Quest 3). Esta configuración también logró un seguimiento de movimiento 3D similar, pero a un costo menor que el Vision Pro.

Más logros con menos esfuerzo

Un detalle interesante del estudio radica en la forma en que se abordó la disparidad de velocidad entre los movimientos humanos y robóticos. Dado que las personas se mueven significativamente más rápido que los robots, los investigadores optaron por reducir la velocidad de las demostraciones humanas en un factor de cuatro durante el entrenamiento. Esta ralentización resultó ser suficiente para que el robot pudiera seguir el ritmo de los movimientos sin necesidad de ajustes más complejos.

En pruebas comparativas, este enfoque de entrenamiento compartido demostró ser superior a los métodos tradicionales, permitiendo al robot manejar tareas más desafiantes, incluyendo aquellas con las que no se había encontrado previamente. Esta iniciativa no es la primera en explorar la enseñanza a robots mediante la observación humana, pero como sucede cuando Apple se involucra, la promesa de una ejecución refinada y una potencial escalabilidad a menudo marca un punto de inflexión.

Puedes seguir a iPadizate en Facebook, WhatsApp, Twitter (X) o consultar nuestro canal de Telegram para estar al día con las últimas noticias de tecnología.

Para ti
Queremos saber tu opinión. ¡Comenta!