/*JULIAN: CÓDIGO CLAUDE /*FIN JULIAN marzo 2025 ~ El blog de Julián Estévez

Inteligencia artificial, robótica, historia y algo más.

30/3/25

¿Y si automatizásemos el descubrimiento científico?

«Imaginemos que las piezas de un puzzle se diseñan y crean de forma independiente y que, al recuperarlas y ensamblarlas, revelan un patrón no diseñado, no intencionado y nunca antes visto, pero un patrón que despierta interés e invita a la interpretación. Estoy convencido de que las piezas de conocimiento creadas de forma independiente pueden albergar un patrón invisible, desconocido e involuntario». - Don R. Swanson


En el panorama en rápida evolución de la inteligencia artificial y la robótica, una de las aplicaciones más intrigantes es el potencial para automatizar el descubrimiento científico. La cuestión no es simplemente si las máquinas pueden generar hipótesis, sino si pueden descubrir conexiones valiosas que los investigadores humanos pasan por alto debido al enorme volumen de literatura científica.

Esta exploración se sitúa en la fascinante intersección de la IA, la recuperación de información y la innovación científica.


La naturaleza combinatoria de la innovación

Una teoría convincente sobre la innovación sugiere que los descubrimientos más valiosos surgen de combinaciones novedosas de ideas existentes. Como demuestra la investigación científica, no se trata de una mera especulación filosófica, sino que existen pruebas empíricas sustanciales que respaldan este punto de vista.

Este concepto, conocido como «innovación combinatoria», combinatorial innovation, sugiere que las nuevas ideas son esencialmente configuraciones novedosas de componentes preexistentes. Tal y como explica el autor Matt Clancy en su blog, incluso la famosa bombilla de Thomas Edison puede entenderse de este modo: Edison probó miles de materiales diferentes combinados con su aparato antes de encontrar un filamento que funcionara. Una vez inventada, la propia bombilla se convirtió en un componente que podía combinarse con otras tecnologías para crear lámparas de escritorio, faros y mucho más.

El método científico como ciclo: La observación conduce a la investigación, la hipótesis, la prueba, el análisis y la comunicación de conclusiones, que a su vez alimentan nuevas observaciones. Cada etapa representa una oportunidad para que la IA ayude al descubrimiento.



Si suponemos que la ciencia es un sistema completamente cerrado en el que nuestros científicos modelo están confinados en laboratorios sin ventanas -sus conocimientos sobre el mundo exterior proceden únicamente de una biblioteca de artículos científicos-, entonces las nuevas observaciones realizadas por estos científicos dependerían necesariamente de las conclusiones comunicadas por otros científicos.

Pero esto no se acerca a la realidad. De hecho, los científicos pasan tiempo fuera de sus laboratorios sin ventanas. Pueden hacer observaciones sobre el mundo que no proceden de algo que han leído. Tienen amigos y colegas con los que a veces discuten estas observaciones, y estas discusiones normalmente no se escriben ni se publican.

A pesar de estas deficiencias, la simplicidad de este modelo de ciencia basado en agentes tiene propiedades computacionales atractivas. Algunas teorías combinatorias de la innovación sugieren que los nuevos descubrimientos son el resultado de combinaciones únicas de conceptos preexistentes, por lo que puede que ni siquiera necesitemos suponer que estos científicos son competentes; sólo necesitamos un número suficiente de ellos para explorar de forma eficiente el espacio combinatorio de hipótesis plausibles. Dado el reciente crecimiento de las capacidades de procesamiento del lenguaje natural, la dependencia exclusiva de este modelo simplificado del texto científico como base para nuevas observaciones científicas suscita una pregunta: ¿podríamos automatizar este modelo de científicos y extraer nuevas observaciones científicas únicamente de la literatura científica?



Innovación combinatoria (Combinatorial innovation)

Hace dos décadas, Martin Weitzman, ya fallecido, esbozó las fascinantes implicaciones de los modelos de innovación combinatoria. En su obra de 1998, Weitzman describía la innovación como la combinación de dos ideas o tecnologías existentes que, con una inversión adecuada en I+D y unas circunstancias afortunadas, da lugar a un nuevo concepto o tecnología. Weitzman lo ilustró con la búsqueda de Thomas Edison de un material adecuado para el filamento de las bombillas. Edison probó miles de materiales diferentes en combinación con el diseño de su bombilla antes de encontrar la combinación perfecta. Este proceso no es exclusivo de la bombilla: prácticamente cualquier innovación puede considerarse una nueva combinación de componentes ya existentes.

Un punto importante es que, una vez que se combinan con éxito dos componentes, la nueva idea resultante se convierte en un componente que se puede combinar con otros. Para ampliar el ejemplo de la bombilla de Weitzman, una vez inventada la bombilla, podían inventarse nuevos inventos que utilizaran bombillas como componente tecnológico: cosas como lámparas de escritorio, focos, faros, etcétera.

Uno de los primeros en investigar las posibilidades de automatizar los descubrimientos científicos fue Don R. Swanson. Swanson, uno de los primeros lingüistas computacionales y científicos de la información, sentó las bases de lo que se convertiría en el campo del descubrimiento basado en la literatura en un artículo de 1986 titulado «Undiscovered Public Knowledge» (Swanson, 1986). En él, Swanson sostiene que la organización distribuida y en profundidad de la empresa científica genera un importante conocimiento latente que, si se recupera y combina adecuadamente, podría dar lugar a nuevos descubrimientos científicos.

Swanson desarrolló el «procedimiento ABC», según el cual las relaciones existentes entre los conceptos A↔B y B↔C podrían revelar conexiones A↔C no descubiertas. Sus exitosas aplicaciones incluyeron la vinculación del aceite de pescado con el tratamiento del síndrome de Raynaud, del magnesio con el alivio de la migraña y del atletismo de resistencia con el riesgo de fibrilación auricular, todo ello validado posteriormente por ensayos clínicos.

Lo que hace especialmente fascinante el trabajo de Swanson es el contexto personal que subyace a sus descubrimientos. Como revela la bibliografía, el propio Swanson padecía el síndrome de Raynaud y migrañas frecuentes. A pesar de ser un ávido corredor que completó una media maratón a los 80 años, sufrió una fibrilación auricular crónica que acabó provocándole un derrame cerebral en 2007, lo que puso fin tanto a su carrera como a la científica. Sus propios problemas de salud probablemente guiaron su interés por la investigación, un recordatorio de que incluso los descubrimientos científicos «objetivos» suelen estar impulsados por la experiencia personal.

La evolución de los métodos manuales de Swanson a las modernas técnicas de IA representa un salto cuántico en nuestra capacidad para extraer conocimientos ocultos.

Investigadores como Tshitoyan et al. (2019) han demostrado que los algoritmos de aprendizaje no supervisado pueden capturar relaciones significativas entre conceptos científicos. Mediante el análisis de 3,3 millones de resúmenes de ciencias de los materiales publicados entre 1922 y 2018, crearon representaciones vectoriales que predijeron con éxito futuros materiales termoeléctricos antes de que se confirmaran experimentalmente.

Uno de los hallazgos más notables fue que sin ningún conocimiento científico previo codificado, el modelo Word2Vec aprendió a realizar aritmética vectorial significativa que coincidía con las propiedades físicas reales.


La extraña dinámica de la innovación combinatoria

Uno de los aspectos más fascinantes de la innovación combinatoria es su peculiar patrón de crecimiento. Martin Weitzman demostró en 1998 que los procesos combinatorios empiezan lentamente pero acaban explotando en productividad.

Para ilustrar este concepto, contrastemos un ejemplo sencillo pero contundente: Empiece con 100 ideas. Las posibles parejas únicas que se pueden crear son 4.950. Si sólo el 1% de estas combinaciones producen nuevas ideas viables, tendríamos 49 nuevas ideas. Ahora tenemos 149 ideas, que pueden formar 11.026 pares posibles. Tras eliminar las 4.950 que ya hemos investigado, quedan 6.076 nuevas combinaciones por explorar. Si el 1% de ellas son viables, añadimos 61 ideas más. El proceso continúa, y cada iteración produce más y más ideas.

El crecimiento de las ideas a través de la innovación combinatoria: Al principio, el crecimiento se asemeja a un proceso exponencial, pero en el periodo 6 se produce una explosión en la que las nuevas ideas de cada periodo empequeñecen todo el conocimiento acumulado anterior.

Lo sorprendente es que este patrón refleja fielmente la historia de la innovación humana y el crecimiento económico:



En realidad, el autor Matt Clancy también recopila algunas formas interesantes de medir cómo se combinan las viejas ideas en los trabajos de investigación para obtener las nuevas ideas más impactantes. Bastante interesante, en mi opinión.

El Proceso de Poincaré: Cómo las grandes mentes buscan en el espacio combinatorio

Henri Poincaré, uno de los matemáticos más grandes de la historia, ofreció una visión extraordinaria de cómo la mente humana navega por los espacios combinatorios en su ensayo sobre la creación matemática:

«Una noche, en contra de mi costumbre, bebí café solo y no pude dormir. Las ideas surgían en tropel; las sentía chocar hasta que los pares se entrelazaban, por así decirlo, formando una combinación estable. A la mañana siguiente había establecido la existencia de una clase de funciones fuchsianas, las que proceden de la serie hipergeométrica; sólo tenía que escribir los resultados, lo que me llevó unas pocas horas».


Poincaré reconocía que para innovar con éxito es necesario navegar eficazmente por el vasto paisaje combinatorio:

«Inventar, he dicho, es elegir; pero la palabra quizá no sea del todo exacta. Hace pensar en un comprador ante el que se expone un gran número de muestras y que las examina, una tras otra, para elegir. En este caso, las muestras serían tan numerosas que no bastaría toda una vida para examinarlas. Esta no es la realidad. Las combinaciones estériles ni siquiera se presentan a la mente del inventor. Nunca aparecen en el campo de su conciencia combinaciones que no sean realmente útiles, salvo algunas que él rechaza pero que tienen hasta cierto punto las características de las combinaciones útiles


Esta descripción coincide precisamente con lo que esperamos que puedan lograr los sistemas de IA: navegar de forma eficiente por el espacio combinatorio para identificar combinaciones prometedoras que los humanos podrían pasar por alto.


Conclusión: El mundo por descubrir del conocimiento científico

Ya hemos experimentado muchas formas de automatización del proceso de innovación:
- el tratamiento de textos automatiza ciertas tareas de composición tipográfica asociadas a la redacción de nuestros resultados
- los paquetes estadísticos automatizan análisis estadísticos que antes se realizaban a mano o escribiendo código personalizado
- Google ha «automatizado» el recorrido por las estanterías de la biblioteca y el hojeo de revistas antiguas
- Elicit automatiza muchas partes del proceso de revisión bibliográfica.
- AphaFold automatiza el descubrimiento de la estructura tridimensional de las proteínas.
- La demostración automatizada de teoremas puede hacer justo lo que su nombre indica.

El crecimiento exponencial de la literatura científica significa que ningún investigador puede dominar todos los conocimientos pertinentes, ni siquiera dentro de especialidades muy concretas. Sólo las ciencias de la vida cuentan con más de 37 millones de artículos en la base de datos bibliográfica OpenAlex, la mayor cantidad de cualquier materia. Dentro de este vasto océano de conocimientos, es probable que permanezcan ocultas innumerables conexiones valiosas.

La cuestión última no es si la IA puede acelerar la ciencia, sino si sus recursos cognitivos pueden escalar con la suficiente rapidez para seguir el ritmo del crecimiento explosivo de las posibilidades combinatorias.

Las herramientas de IA que nos ayudan a navegar y conectar conocimientos entre dominios no sustituirán a los científicos humanos, sino que se convertirán en sus compañeros esenciales en la exploración. El futuro no pertenece a quienes confían ciegamente en la IA ni a quienes la rechazan por completo, sino a quienes aprenden a convivir con estas nuevas herramientas, aprovechando sus puntos fuertes y compensando sus puntos débiles mediante la creatividad humana, el pensamiento crítico y la validación experimental.

Los grandes modelos de lenguaje (LLM), como Deep Research, representan una nueva y poderosa herramienta en este proceso de descubrimiento combinatorio. Al procesar y conectar eficazmente conceptos de millones de artículos científicos, los LLM pueden identificar patrones y relaciones que, de otro modo, permanecerían ocultos en nuestro fragmentado panorama científico. Al igual que Swanson conectó manualmente literatura dispar para descubrir avances médicos, los LLM modernos pueden realizar conexiones similares a una escala y velocidad sin precedentes. Sin embargo, el enfoque más productivo probablemente reflejará la idea de Poincaré: estas herramientas no se limitarán a generar combinaciones aleatorias, sino que ayudarán a los investigadores a navegar por el vasto espacio combinatorio de forma más eficiente, destacando las conexiones prometedoras que merezcan una mayor investigación. En este paradigma emergente, los científicos humanos que desarrollen relaciones simbióticas con estos sistemas de IA -guiando su exploración al tiempo que aprovechan sus capacidades de reconocimiento de patrones- abrirán nuevas fronteras de descubrimiento científico que ni los humanos ni las máquinas podrían alcanzar por sí solos.




Comparte:

19/3/25

El auge y caida de los robots para restaurantes

A mediados de la década de 2010, Silicon Valley estaba en plena efervescencia con una nueva frontera: la robótica para restaurantes. El capital riesgo se volcó en startups que prometían revolucionar la forma de fabricar, distribuir y consumir alimentos mediante la automatización. La premisa era convincente: solucionar la escasez de mano de obra, mejorar la uniformidad, reducir costes y ofrecer mejores alimentos más rápidamente. ¿Qué podía salir mal?

Casi una década después, el panorama está plagado de empresas desaparecidas, ambiciones reducidas y giros que se alejan de las visiones originales centradas en los robots. Tras pasar años observando este sector, quiero examinar qué ha pasado con la gran revolución robótica en el sector de la alimentación y qué podemos aprender de sus dificultades.


La gran fiebre del oro de los robots

Podría decirse que la revolución de los robots en el sector de la restauración comenzó en torno a 2015 en San Francisco. En pocos años, vimos aparecer la automatización en todas las etapas de la producción de alimentos:

    - Zume Pizza utilizó robots para preparar y cocinar pizzas.
    - Cafe X y Truebird desplegaron quioscos de café robotizados                    
    - Creator y Miso Robotics volteaban hamburguesas.
    - Spyce sirvió cuencos de cereales autónomos
    - Blendid preparaba batidos
    - Hyphen automatizó líneas de montaje de alimentos
    - Nuro y Coco se encargaban del reparto robotizado

Entonces llegó COVID, que debería haber sido el momento de la robótica alimentaria. En un momento en que los restaurantes se enfrentaban a retos laborales sin precedentes y los clientes exigían un servicio sin contacto, la propuesta de valor de la automatización parecía más fuerte que nunca.


La caída: Por qué los robots no lograron tomar el relevo

A pesar de la tormenta perfecta de oportunidades, la revolución se estancó. Las empresas que en su día recibieron una cobertura mediática impresionante desaparecieron en silencio:

Zume Pizza, una vez valorada en más de 2.000 millones de dólares, cerró sus operaciones de pizza en enero de 2020 y se retiró por completo en 2023. Cafe X, Truebird y BBox cerraron o redujeron sus operaciones. Creator cerró sus puertas. Spyce fue adquirida, pero su tecnología se abandonó en gran medida.

¿Qué ha fallado? Los problemas parecen clasificarse en varias categorías.




Por qué los robots alimentarios no escalan

El sector de la robótica hostelera se enfrentó a tres retos fundamentales que impidieron su adopción generalizada. En primer lugar, el desarrollo de hardware resultó excepcionalmente difícil en los restaurantes. Los espacios reducidos de las cocinas, la variabilidad natural de los alimentos y los problemas de mantenimiento crearon obstáculos importantes. Los aspectos económicos rara vez funcionaban: a menos que un robot eliminara por completo un puesto a tiempo completo, la rentabilidad de la inversión seguía siendo poco convincente para los operadores que se enfrentaban a elevados costes iniciales.

En segundo lugar, a la mayoría de las empresas les faltaba poner el foco en algo concreto. «A todo el mundo se le decía que hiciera de todo», y se lanzaban proyectos al azar antes de que nadie determinara su viabilidad. Este patrón de empresas que se presentaban como plataformas en lugar de perfeccionar aplicaciones específicas dispersaba peligrosamente los recursos.

En tercer lugar, muchas startups crearon primero una tecnología impresionante y luego buscaron problemas que resolver. Este enfoque retrógrado dio lugar a innovaciones que los restaurantes sencillamente no necesitaban.


Zume: Cómo se esfumaron 445 millones de dólares

La historia de Zume es la más aleccionadora de la robótica alimentaria. Inicialmente llamó la atención por sus robots pizzeros con nombres italianos como «Pepe» y «Bruno», pero las ambiciones de su fundador, Alex Garden, se expandieron rápidamente más allá de la pizza. Presentó a Zume como «el Amazon de la alimentación», con la visión de controlarlo todo, desde la agricultura hasta el envasado. Masayoshi Son, de SoftBank, quedó tan cautivado que invirtió 375 millones de dólares, valorando Zume en 2.500 millones.

Esta inversión masiva aceleró la caída de Zume en lugar de evitarla. Al parecer, Garden «vio la financiación de SoftBank como un mandato para volverse loco», adquiriendo una empresa de envasado, lanzando proyectos agrícolas a Arabia Saudí, explorando tecnologías de seguimiento de alimentos, invirtiendo en otra cadena de pizzerías e incluso comprando un autobús de dos pisos personalizado con un sistema audiovisual de 100.000 dólares, todo ello mientras el negocio principal de pizzas perdía aproximadamente 150 dólares por pizza entregada.

Cuando la fallida salida a bolsa de WeWork obligó a SoftBank a exigir autosuficiencia a las empresas de su cartera, Zume se derrumbó rápidamente, despidiendo a 560 empleados a lo largo de dos rondas en 2020 antes de su liquidación final en 2023.


Situación actual de la automatización en restaurantes

A pesar de estos contratiempos, la automatización hostelera no ha desaparecido por completo. El mercado se ha racionalizado y las empresas se centran en aplicaciones más modestas y prácticas:

    - La automatización de la trastienda: Empresas como Hyphen y Vebu han recibido inversiones del fondo Cultivate Next de Chipotle, centrándose en tareas específicas de cocina en lugar de la automatización completa.

    - Automatización digital: Las cadenas de restaurantes han adoptado ampliamente los quioscos de pedidos y la IA para la toma de pedidos en el drive-thru de empresas como SoundHound y Google. Estas tecnologías reasignan la mano de obra sin necesidad de costosos robots.

    - Aplicaciones especializadas: Algunos casos de uso específicos, como el robot de servicio XI de SoftBank y el robot de limpieza Scrubber 50 Pro, están encontrando una adopción limitada cuando la tarea es sencilla y repetitiva.

Las empresas que han sobrevivido comparten rasgos comunes: resuelven problemas específicos, tienen una economía unitaria realista y mejoran las métricas básicas de los restaurantes en lugar de limitarse a exhibir una tecnología atractiva.


Lecciones aprendidas

El auge y el declive de la robótica en restaurantes ofrecen valiosas lecciones tanto para los emprendedores como para los inversores:

    1- Empezar por el problema, no por la tecnología: Las innovaciones de éxito abordan problemas reales en lugar de desplegar la tecnología porque sí.

    2- La concentración vence a la grandiosidad: Las empresas que perfeccionan una única aplicación antes de ampliar su visión tienen mayores tasas de supervivencia.

   3- Evite las ideas locas: Ni la historia más convincente puede superar modelos de negocio insostenibles.

    4- El hardware es diferente del software: El enfoque de «moverse rápido y romper cosas» no funciona bien cuando hay equipos físicos y seguridad alimentaria de por medio.

    5- A veces es mejor simplificar: Un empleado humano a 17 dólares la hora puede ser más rentable que un sistema robotizado de un millón de dólares.

La revolución de los robots en el sector alimentario no ha muerto, pero ha sido humillada. La próxima oleada vendrá probablemente de las empresas que aprendan estas lecciones, centrándose en mejoras graduales de los problemas reales de los restaurantes en lugar de promesas de reinventar toda la industria.

Hasta entonces, los humanos seguirán haciendo la mayoría de nuestras comidas, aunque a veces les ayuden máquinas cada vez más inteligentes. Es probable que el futuro de la restauración no esté totalmente automatizado, sino más bien potenciado de forma que mejore lo que los humanos ya hacen bien.

Ya veremos.





Comparte:

12/3/25

Tras el hype de las demostraciones de robots humanoides

Hace unos días, Figure, una de las empresas de robótica más avanzadas especializada en el desarrollo de robots humanoides impulsados por IA, lanzó un nuevo vídeo de demostración de sus innovaciones para presentarnos su sistema Helix.


La demostración tiene lugar en una cocina: una persona trae una bolsa de la compra y saca los artículos que contiene en una mesa frente a los robots. A continuación, la persona sale de la habitación y los robots empiezan a inspeccionar los productos y a trabajar juntos para introducirlos en el frigorífico.

No es casualidad que la empresa anunciara que Helix representa un gran avance para los robots que manipulan paquetes en entornos de almacenamiento y logística. Hablaré de logística más adelante, pero antes, sigamos explicando el sistema Helix.

Según Figure -fundada en 2022-, Helix es un sistema de aprendizaje basado en imágenes y texto que permite a los robots aprender a interactuar con su entorno. La empresa ha publicado dos artículos sobre Helix, uno de los cuales es la nota de prensa, y el otro es una explicación técnica más detallada de este desarrollo técnico. En este segundo artículo, también se detalla que Figure ha entrenado a los robots durante 500 horas, y que la comida que la persona saca de la bolsa y muestra a los robots, son «objetos» que los humanoides nunca han visto durante su entrenamiento.

Las 500 horas de entrenamiento, en mi opinión, se quedan cortas. En ese tiempo se puede entrenar al robot para que realice muy pocas tareas, y aprender a andar no es, desde luego, una de ellas. Entonces, ¿qué intenta demostrar Figure con esta demostración?

Supongo que la empresa pretendía que cualquier espectador exclamara asombrado «wow», al ver robots humanoides colaborando. Sin embargo, como profesional de la robótica que soy, me surgen varias preguntas: ¿están obligados los robots a colaborar entre sí, puede un solo robot meter artículos en la nevera sin ayuda del otro, son los dos robots totalmente autónomos, o hay una inteligencia central, algo así como una inteligencia de colmena, que controla a los dos robots juntos, o hay una inteligencia central, algo así como una inteligencia de colmena, que controla a los dos robots juntos? Me encantaría entender ese truco.


Los robots humanoides de las demostraciones no son autónomos

Anteriormente, Figure colaboraba con OpenAI, que dotaba a sus robots de inteligencia artificial. Sin embargo, supongo que la presentación de Helix es una beneficiosa operación de marketing para anunciar que ya han sustituido a la empresa de Sam Altman.

Desde la época de Boston Dynamics, los vídeos de demostración de robots tienen un nivel muy alto. Pero mucho me temo que la mayoría de esas demostraciones son en gran medida marketing. Y hay que tener en cuenta que la mayoría de esas coreografías de humanoides son teleoperadas por humanos, como esos robots de Tesla preparando cócteles.

Quizá una de las mayores ideas falsas sobre los robots de Boston Dynamics es que completan estas acciones sin ayuda externa. En realidad, no es ningún secreto que la ayuda humana sigue siendo muy necesaria. En realidad, la mayor parte del trabajo lo hacen los humanos y por control remoto, pero también hay computación a bordo.

Estos robots no son autónomos en el sentido en que lo somos nosotros. Siguen una serie de rutinas bien definidas, no tienen capacidad para decidir por sí mismos qué hacer.


La logística es el objetivo a largo plazo de los humanoides

Comparado con la movilidad sobrehumana del robot humanoide de Boston Dynamics, el robot que actualmente está trastornando el sector de los almacenes puede parecer positivamente aburrido.

Stretch es uno de los primeros robots comerciales diseñados para realizar una de las tareas más tediosas y agotadoras del almacén: descargar cajas. Aunque menos llamativo que el anticuado Atlas, Stretch no es menos sobrehumano, está construido sobre una base técnica compartida y ofrece una potente funcionalidad y rentabilidad para las operaciones de almacén.

Stretch ayuda a los empleados a evitar lesiones frecuentes en el trabajo de descarga manual. Así pueden dedicarse a otras tareas del almacén, como el control de calidad y la preparación de pedidos, que se benefician del razonamiento y la destreza humanos. Stretch está preparado para asumir el trabajo monótono y agotador de descargar contenedores en varios turnos, siete días a la semana.

Aunque el robot Stretch de hoy no se parece mucho a la versión comercial de Atlas anunciada recientemente, ambos surgieron de la misma investigación inicial sobre manipulación móvil. De hecho, la idea de diseñar un robot de almacén surgió después de que los clientes respondieran a un vídeo de 2016 de un robot Atlas levantando y transportando cajas. Un nuevo mercado acudió a la llamada.

«Estábamos haciendo una investigación interna sobre la manipulación con Atlas, y casualmente utilizamos cajas para esta demostración», confiesa un responsable de la empresa. «Cuando publicamos este vídeo, recibimos muchas llamadas diciendo que Atlas sería perfecto para un almacén y: 'Queremos comprar uno'. Sabíamos que no era realmente el producto adecuado en ese momento, pero nos dimos cuenta de que era un indicio de una necesidad del mercado.»




Así que esto da una idea clara de lo que se necesita todavía en la industria. Y de momento, no estoy seguro de que los robots humanoides estén preparados para largas sesiones de trabajo haciendo precisamente esto:




El robot Atlas de Boston Dynamics, aunque impresiona por sus capacidades, aún se enfrenta a importantes limitaciones para un trabajo sostenido en el mundo real. En 2023, ArsTechnica escribió un interesante artículo en el que informaba de la demostración realizada por Boston Dynamics de las nuevas manos de agarre de Atlas y de tareas relacionadas con la construcción. El robot podía manipular objetos «inercialmente significativos» y realizar movimientos complejos mientras transportaba objetos pesados, pero sigue teniendo problemas de equilibrio, precisión y durabilidad. El artículo muestra numerosos casos en los que Atlas se cae y falla, y sus garras dañan los materiales que manipula. El robot funciona con capacidades de visión limitadas (sólo una cámara en color y LiDAR) y requiere movimientos preprogramados en lugar de una verdadera autonomía. Estas limitaciones indican que, a pesar de sus espectaculares habilidades en demostraciones controladas, Atlas aún no está preparado para el trabajo adaptable y sostenido que se requiere en entornos impredecibles del mundo real, como una obra de construcción real.

Tampoco puedo imaginar cómo Figure podría ser en este momento mejor en el seguimiento de la actividad que una empresa especializada como Vanderlande:








Comparte:

2/3/25

¿Por qué no tenemos aún robots mejores?

En el campo de la robótica, en rápida evolución, ha surgido una tesis provocadora: «Los datos son todo lo que necesitas». Este concepto, que se basa en el famoso artículo Attention is All You Need (La atención es todo lo que necesitas), que revolucionó el procesamiento del lenguaje natural, representa una nueva perspectiva sobre cómo podríamos conseguir por fin robots capaces y de uso general.

Este enfoque es fascinante porque no rechaza la ingeniería robótica tradicional en favor del puro aprendizaje automático. En su lugar, aboga por un enfoque híbrido que combine lo mejor de ambos mundos: métodos de aprendizaje basados en datos junto con lo que podría llamarse «ingeniería a la antigua» (GOFE, Good Old Fashioned Engineering), un bonito homenaje a la GOFAI (Good Old Fashioned Artificial Intelligence) de los primeros tiempos de la investigación en IA.

La idea central es que los robots, a diferencia de los sistemas de IA puramente digitales, deben interactuar con el impredecible mundo físico. Esta realidad significa que incluso las redes neuronales más sofisticadas deben basarse en sólidos principios de ingeniería que respeten las limitaciones físicas y los requisitos de seguridad.

Fuente

Grandes modelos de acción robótica (LRAM)

En el centro de esta visión se encuentran los modelos de acción de grandes robots (LRAM, Large Robotic Action Models), paralelos a los grandes modelos lingüísticos que han transformado la IA. Estos LRAM aprenden de vastos conjuntos de datos de acciones, comportamientos y resultados de robots en diversos entornos y tareas.

Lo que hace poderoso a este enfoque es su capacidad de generalización. En lugar de programar robots para tareas específicas, las LRAM pueden aprender patrones subyacentes de estrategias de manipulación exitosas que se transfieren a distintos escenarios. Un robot que aprende a coger un lápiz puede aplicar principios similares para coger un destornillador sin necesidad de reprogramación explícita.

En la charla TED «¿Por qué aún no tenemos mejores robots?», el investigador Ken Goldberg aborda una pregunta que muchos nos hemos hecho. La respuesta es sorprendentemente directa: la robótica se enfrenta a retos de datos únicos que han ralentizado el progreso en comparación con otros dominios de la IA. A diferencia del reconocimiento de imágenes o el procesamiento del lenguaje natural, donde los datos son abundantes y fáciles de recopilar a escala, las interacciones de los robots con el mundo físico son:

  • costosas de generar (requieren hardware físico)

  • consumen mucho tiempo (las acciones físicas requieren tiempo real)

  • difíciles de paralelizar (a diferencia de las tareas puramente computacionales).


Sin embargo, algunos indicios apuntan a un nuevo momento ChatGPT en robótica.


Las dos revoluciones de los datos: Simulación y recogida en el mundo real

Dos desarrollos paralelos pueden estar convergiendo para hacer realidad la visión de «Los datos son todo lo que necesitas»: los entornos de simulación de alta fidelidad y la recopilación generalizada de datos de RA/VR.

La revolución de la simulación de NVIDIA

NVIDIA se ha situado a la vanguardia de la simulación robótica con plataformas como Isaac Sim y Omniverse. Estos entornos permiten a los robots entrenarse en mundos virtuales fotorrealistas que modelan con precisión la física, los materiales y las interacciones entre objetos. Lo que antes llevaba meses de entrenamiento de robots físicos ahora puede hacerse en entornos virtuales acelerados, generando millones de muestras de interacción de la noche a la mañana.

Este planteamiento resuelve varios problemas detectados en el campo de la robótica:

  • Escala: Las simulaciones pueden ejecutar miles de escenarios paralelos

  • Diversidad: Los entornos virtuales pueden variar infinitamente.

  • Seguridad: Los robots pueden fallar catastróficamente en la simulación sin consecuencias en el mundo real.

  • Rentabilidad: Sin depreciación ni daños en el hardware físico


Las simulaciones de NVIDIA encajan perfectamente con la visión de LRAM, ya que generan los enormes conjuntos de datos de interacción necesarios para la generalización entre tareas. Sin embargo, la simulación por sí sola se enfrenta a un reto crítico: la brecha de la realidad. Los entornos virtuales, por sofisticados que sean, siguen siendo diferentes del impredecible mundo real.

Fuente



La estrategia de datos del mundo real de META

Aquí es donde META y las gafas de realidad mixta de otros gigantes tecnológicos entran en escena, cerrando potencialmente la brecha entre simulación y realidad. Dispositivos como las Quest de Meta, las gafas inteligentes de Ray-Ban y otros productos similares de Apple, Google y otros representan mecanismos de recopilación de datos del mundo real sin precedentes.

Estas gafas, que llevan millones de usuarios en entornos cotidianos, capturan datos visuales de cómo los seres humanos interactúan de forma natural con su entorno. Cada vez que alguien coge un objeto de forma extraña, sortea obstáculos inesperados o se adapta a condiciones de luz cambiantes, genera precisamente el tipo de datos de casos extremos que las simulaciones se esfuerzan por producir. Esta recogida pasiva de datos de las interacciones entre las personas y el entorno podría ser el eslabón que falta entre el entrenamiento simulado y el rendimiento robótico en el mundo real.

Fuente


Aunque los problemas de privacidad son importantes y deben abordarse, el potencial técnico es enorme. Combinando las capacidades de simulación de NVIDIA con los datos de observación del mundo real de META, los investigadores en robótica podrían entrenar modelos que salvaran la brecha de la realidad, aprendiendo tanto los fundamentos basados en la física como las adaptaciones matizadas necesarias para el éxito en el mundo real.

El resultado podría ser exactamente lo que la tesis «Data is All You Need» imagina: Grandes modelos de acción robótica entrenados a partir de datos diversos y multimodales que se generalicen en distintos entornos y tareas.

La convergencia: Simulación, realidad e ingeniería


Imaginemos este círculo virtuoso:

  • Los robots se entrenan inicialmente en entornos simulados de NVIDIA.

  • Las gafas de realidad aumentada de META captan cómo los humanos interactúan con los robots y los corrigen.

  • Estos datos de retroalimentación mejoran tanto los entornos de simulación como los modelos de robot
  • Los principios de ingeniería garantizan la seguridad y la fiabilidad en todo momento


Esta visión emergente sugiere que nos estamos acercando a un punto de inflexión en la robótica. A medida que estos métodos complementarios de recopilación de datos maduren y los LRAM se vuelvan más sofisticados, es posible que asistamos a un salto discontinuo en las capacidades de los robots similar al que hemos visto con los grandes modelos lingüísticos.

Para quienes esperan con impaciencia los robots ayudantes prometidos por décadas de ciencia ficción, esta convergencia ofrece un optimismo realista. De hecho, se avecinan mejores robots, impulsados por las capacidades de recopilación de datos sin precedentes de las plataformas de simulación y los dispositivos de realidad aumentada y realidad virtual de uso cotidiano, combinadas con sólidos fundamentos de ingeniería.

Puede que los datos no sean literalmente «todo lo que se necesita», pero podrían ser el ingrediente crítico que finalmente convierta a los robots de uso general en una realidad práctica.
Y la próxima vez que alguien pregunte por qué su casa aún no se parece a «Los Jetsons», puedes explicarle cómo las gafas META de su amigo podrían estar ayudando silenciosamente a resolver ese mismo problema.



Comparte:

Nos leemos:

descripción descripción descripción

Recibe las entradas por correo

En mi mesilla

Blog Archive

Licencia Creative Commons