El blog de Julián Estévez: opinión

Mostrando entradas con la etiqueta opinión. Mostrar todas las entradas

9/3/26

Anthropic, Trump y el gran teatro de los principios en Silicon Valley

marzo 09, 2026 No comments

Hay un relato que circula estos días por los medios tecnológicos: Dario Amodei, CEO de Anthropic, es el héroe que sacrificó contratos millonarios con el Departamento de Defensa estadounidense por sus convicciones éticas. Frente a él, Sam Altman como el pragmático sin escrúpulos que se doblegó ante Trump. Blanco y negro. Bueno y malo. Simple y atractivo.

El problema, como siempre, es que la realidad es más incómoda.

El mártir de los principios selectivos

Empecemos por el elefante en la sala: la negativa de Anthropic al espionaje masivo se aplica, según sus propias publicaciones, específicamente a ciudadanos estadounidenses. No a cualquier persona. A ciudadanos de EE. UU.

Esto no es un detalle menor. Significa que el uso de Claude para vigilancia fuera de territorio americano no parece constituir un problema ético para Anthropic. Que los principios tengan pasaporte es, cuanto menos, una información relevante cuando alguien te presenta a esta empresa como modelo de rectitud tecnológica.

Lo mismo ocurre con las armas autónomas. Anthropic se opone actualmente al uso de Claude en sistemas que identifiquen y disparen a objetivos sin intervención humana. La palabra clave es "actualmente", y está escrito en su manifiesto. Dario Amodei ha sugerido en distintas ocasiones que el modelo simplemente no está preparado técnicamente para ese nivel de autonomía todavía. No que se opongan categóricamente a la letalidad autónoma en el futuro. Es una postura técnica disfrazada de postura ética.

Y hay más: Anthropic no es ajena al sector de defensa. Sus modelos ya han sido utilizados en operaciones militares de alto perfil (la captura de Maduro en Venezuela) como herramienta favorita del ejército estadounidense a través de Palantir. El mártir tiene historial.

Kathy Perry apoyó a Anthropic y eso llevó a cientos de memes y una campaña viral

La jugada de OpenAI: Groucho Marx en el Pentágono

Mientras Anthropic era catalogada como "riesgo para la cadena de suministro" (un castigo que recuerda al trato dado a Huawei), Sam Altman navegó la situación con una habilidad que merece análisis. La diferencia entre ambas empresas no es fundamentalmente moral. Es técnica y política.

Anthropic quería que las restricciones éticas estuvieran incrustadas directamente en el modelo, en su "constitución". Esto implica que el Departamento de Defensa no podría saltárselas aunque quisiera: las limitaciones estarían en el código, no en un contrato. Para la administración Trump, esto es inaceptable. No porque quieran espiar ciudadanos americanos necesariamente, sino porque nadie cede el control operativo de una herramienta militar a los ingenieros de una empresa privada de San Francisco.

OpenAI, en cambio, aceptó un modelo radicalmente distinto: salvaguardas por contrato, no por código. "Usad nuestros modelos, os prometemos que respetaréis las restricciones acordadas." La responsabilidad del cumplimiento recae en el Departamento de Defensa, no en la arquitectura de la IA.

Es la diferencia entre un empleado que te dice "tengo principios que no puedo saltarme" y otro que dice "tengo principios, pero confío en que tú tampoco querrás que los violemos." Trump eligió al segundo. Es comprensible.

¿Quién tiene razón?

Esta es la pregunta que los medios no suelen hacer porque no tiene respuesta limpia. El enfoque de Anthropic con restricciones en el modelo, tiene una lógica de seguridad robusta: si las limitaciones son estructurales, no dependen de la buena voluntad del cliente. En un mundo donde los contratos se reinterpretan y las administraciones cambian, esto no es un detalle menor.

Pero también tiene un problema de arrogancia institucional considerable: implica que Anthropic, una empresa privada, decide unilateralmente qué puede y qué no puede hacer el ejército de la primera potencia mundial. Esa es una posición política, no solo técnica, y tiene consecuencias políticas.

OpenAI cedió el control a cambio de relevancia. Anthropic mantuvo el control a costa de ser excluida. Ninguna de las dos posiciones es obviamente correcta.

Lo que sí es obvio es que el relato del "mártir con principios" es, como mínimo, incompleto. Y que en el tablero real de la IA militar, los principios se negocian, se gradúan por geografía y se posponen cuando la tecnología no está lista.

Bienvenidos a la ética en Silicon Valley.

Ya veremos.

Comparte:

2/3/26

Por qué las armas totalmente autónomas no pueden existir legalmente (todavía)

marzo 02, 2026 No comments

Cada pocos meses, un titular anuncia que los robots asesinos ya están aquí. Un nuevo dron alcanza un objetivo, un algoritmo identifica una amenaza, un contratista de defensa presenta un prototipo, y la imaginación colectiva salta a escenarios tipo Terminator en los que las máquinas libran guerras por su cuenta. Pero esta es la incómoda verdad que ni Hollywood ni el ciclo de exageración del sector defensa quieren que escuches: bajo los marcos legales y doctrinales que actualmente rigen la guerra entre las democracias occidentales, desplegar armas letales totalmente autónomas es esencialmente imposible desde el punto de vista legal.

No se trata de una limitación tecnológica. Es una limitación legal e institucional. Y las pruebas provienen de los propios documentos, doctrinas y marcos éticos que los aliados de la OTAN y el Departamento de Defensa de EE.UU. han construido meticulosamente durante la última década.

¿Qué entendemos por "totalmente autónomo"?

Primero, aclaremos la terminología. Un sistema de armas totalmente autónomo sería aquel capaz de buscar, identificar, seleccionar y atacar objetivos de forma independiente, sin ninguna intervención humana. Sin humano en el bucle (in the loop). Sin humano sobre el bucle (on the loop). La máquina decide quién muere.

Como han demostrado los investigadores Taddeo y Blanchard en su análisis comparativo de las definiciones de sistemas de armas autónomos, ni siquiera la comunidad internacional se pone de acuerdo en una definición precisa. Pero la línea divisoria fundamental está clara: un sistema en el que un humano mantiene un control significativo sobre la decisión de usar la fuerza, frente a otro en el que la máquina actúa enteramente por su cuenta. Es esta última categoría la que el derecho vigente prohíbe de forma efectiva.

La doctrina de la Kill Chain

El concepto de la "kill chain" (cadena de eliminación) es central para entender por qué la autonomía total es legalmente inviable. La kill chain es el proceso paso a paso que utiliza el ejército para atacar un objetivo: encontrar, fijar, rastrear, apuntar, atacar y evaluar. En cada etapa, se espera que el juicio humano garantice el cumplimiento de los principios del derecho internacional humanitario (DIH): distinción entre combatientes y civiles, proporcionalidad en el uso de la fuerza y precaución en el ataque.

CNAS

Tenemos ya evidencia de que la Fuerza Aérea de EE.UU ya ha desplegado algoritmos de IA en cadenas operativas reales de selección de objetivos Estos algoritmos tenían el objetivo de acelerar la kill-chain. Pero acelerar la kill chain y eliminar a los humanos de ella son cosas fundamentalmente distintas. Sin embargo, el impulso actual hacia una toma de decisiones más rápida y asistida por máquinas evita con demasiada frecuencia la pregunta crítica: ¿en qué punto la velocidad elimina la posibilidad de un juicio humano significativo? El ataque con dron en Kabul de agosto de 2021, que mató a diez civiles, incluidos siete niños, es un doloroso recordatorio de que incluso con humanos en el bucle se producen errores en la selección de objetivos. Eliminar a los humanos por completo haría que la rendición de cuentas por tales tragedias fuera prácticamente imposible.

No obstante, diferentes artículos publicados en medios especializados de tecnología militar desmienten que en el caso de usar algoritmos haya un vacío de responsabilidad, ya que el comandante militar es siempre directa e individualmente responsable del empleo de todos los métodos y medios de guerra. La responsabilidad del comandante impregna el campo de batalla. Este marco de rendición de cuentas, enraizado en el Código Uniforme de Justicia Militar y en el derecho de los conflictos armados, simplemente no puede funcionar si una máquina toma decisiones letales de forma independiente, porque no se puede someter a un consejo de guerra a un algoritmo.

No debemos obviar la importancia de un proceso deliberado de rendición de cuentas: cuando algo sale mal (y en la guerra, siempre sale algo mal) debe existir una cadena rastreable de decisiones humanas que pueda ser investigada. Un sistema totalmente autónomo, por definición, rompe esa cadena.

Los propios principios éticos del Departamento de Defensa dicen que no

En febrero de 2020, el Departamento de Defensa de EE.UU. adoptó cinco principios para el uso ético de la IA: responsable, equitativo, trazable, fiable y gobernable. Este último -gobernable- es el que lo cambia todo. Exige que los sistemas de IA posean la capacidad de desconectar o desactivar sistemas desplegados que muestren un comportamiento no deseado. Un arma totalmente autónoma que selecciona y ataca objetivos sin supervisión humana es, por diseño, ingobernable en el momento que más importa: el instante de la fuerza letal.

Como argumentó Jorrit Kamminga en War on the Rocks, los principios éticos del Departamento de Defensa fueron un compromiso público que ahora obliga a Estados Unidos a informar sobre sus progresos y a rendir cuentas por las discrepancias entre sus políticas y sus prácticas reales. Los principios no son mero escaparate; representan un compromiso performativo que restringe la acción futura. Ya se consideren como una postura ética genuina o como un movimiento estratégico para reclamar la superioridad moral, el efecto práctico es el mismo: el marco institucional no permite la eliminación totalmente autónoma.

Estados Unidos no actúa en solitario. En octubre de 2021, la OTAN adoptó sus propios Principios de Uso Responsable de la IA en Defensa, y en octubre de 2022 publicó un Resumen del Plan de Implementación de Autonomía de la OTAN que dejaba explícita la posición de la Alianza. El plan establece que el uso de sistemas autónomos por parte de la OTAN debe basarse en sus normas, valores y compromiso con el derecho internacional. De forma crucial, se alinea con los principios rectores respaldados por las partes de la Convención sobre Ciertas Armas Convencionales (CCW), que afirman que el derecho internacional humanitario se sigue aplicando plenamente a todos los sistemas de armas, incluido el posible desarrollo y uso de Sistemas de Armas Letales Autónomos (LAWS, por sus siglas en inglés).

La OTAN también estableció una Junta de Revisión de Datos e IA (DARB) para operacionalizar estos principios. El marco de la Alianza exige explícitamente que las fuerzas armadas aliadas dispongan de vías claras para implementar sistemas autónomos habilitados por IA de conformidad con los Principios de Uso Responsable de la OTAN y el derecho internacional. La frase clave que aparece a lo largo de toda la documentación de la OTAN es "niveles adecuados de juicio humano". Una formulación que, aunque deliberadamente flexible, excluye categóricamente el escenario de juicio humano cero que implica la autonomía total.

El muro del Derecho Internacional Humanitario

Incluso sin los principios del Departamento de Defensa o los marcos de la OTAN, las armas totalmente autónomas chocarían contra los cimientos del derecho internacional humanitario. Los principios de distinción y proporcionalidad —codificados en los Convenios de Ginebra y sus Protocolos Adicionales— requieren un juicio humano contextual y situacional que la IA actual simplemente no puede replicar.

Gunawan et al., en su estudio sobre la responsabilidad de mando de las armas autónomas bajo el derecho internacional humanitario, argumentan que el marco existente del DIH se construyó sobre la premisa de que un comandante humano toma las decisiones críticas en un conflicto armado. La doctrina de la responsabilidad de mando hace a los superiores responsables de las acciones de sus subordinados. Pero cuando el "subordinado" es una máquina que opera de forma autónoma, toda esta estructura se derrumba. ¿De quién es responsable el comandante? ¿De un algoritmo escrito por un ingeniero que dejó la empresa contratista de defensa hace tres años? ¿De un conjunto de datos de entrenamiento compilado a partir de imágenes satelitales de un teatro de operaciones diferente?

Esto no es un mero rompecabezas teórico. El capítulo sobre armas autónomas letales en Disruptive Technology and the Law of Naval Warfare (Oxford University Press) examina cómo el derecho de la guerra naval existente lidia con la autonomía, concluyendo que el régimen legal exige juicio humano en el punto de aplicar la fuerza letal. El trabajo de la Universidad de Duke sobre sistemas de armas letales autónomos, subtitulado Reconciliando el mito de los robots asesinos con la realidad del campo de batalla moderno, llega a una conclusión similar: la brecha entre la imaginación pública y la realidad legal es enorme.

RTVE

Ucrania: la prueba de realidad

Si las armas totalmente autónomas estuvieran listas para el mundo real, seguramente la guerra convencional más intensa en Europa desde 1945 las habría revelado. No ha sido así. Tanto Rusia como Ucrania presumieron en diversos momentos de la guerra de haber desplegado drones guiados por IA capaces de identificar y atacar objetivos sin que un operador humano los guiara hasta el impacto. Sin embargo, la revolución nunca se materializó. Un análisis del Center for a New American Security (CNAS) descartó el impacto de los drones con IA en pocas líneas, y un análisis independiente sugirió que Rusia había desactivado la función de guiado por IA de su dron Lancet tras un rendimiento inadecuado.

El consenso de los expertos fue revelador: la tecnología necesita muchas más pruebas e iteraciones. Ambos bandos quieren hacerlo bien antes de escalar. Pero más allá de la inmadurez técnica, las restricciones legales y doctrinales permanecen. Incluso si la IA funcionara a la perfección, desplegar un dron que decide autónomamente matar colocaría a la nación que lo despliega en violación directa de sus propios principios declarados y, posiblemente, del derecho internacional humanitario.

La dimensión nuclear

Las implicaciones se vuelven aún más vertiginosas cuando consideramos la IA y las armas nucleares. Incluso si la tecnología lo permitiera, la toma de decisiones por IA que afecte directamente a las funciones de mando y control nuclear no debería delegarse en máquinas. Los algoritmos que subyacen en los complejos sistemas autónomos actuales son demasiado impredecibles, demasiado vulnerables a ciberataques, demasiado opacos (el problema de la "caja negra") y demasiado frágiles para confiarles decisiones que podrían desencadenar una escalada nuclear.

La compresión de los plazos de decisión que permite la IA es precisamente lo que la hace peligrosa en un contexto nuclear. Si ambos bandos aceleran sus kill chains hasta el punto de exprimir el juicio humano, el riesgo de un error de cálculo catastrófico se dispara. Esto no es una hipótesis; es la consecuencia lógica de eliminar el control humano de sistemas capaces de desencadenar respuestas a nivel estratégico.

Entonces, ¿dónde nos deja esto?

La situación es paradójica. Todas las grandes potencias militares occidentales están invirtiendo masivamente en IA para defensa. Todas las grandes potencias militares occidentales han adoptado también principios, directrices e interpretaciones legales que prohíben el despliegue de armas letales totalmente autónomas. La doctrina de la kill chain exige juicio humano en los puntos de decisión críticos. El derecho internacional humanitario exige distinción, proporcionalidad y precaución, y estos juicios requieren comprensión contextual humana. La responsabilidad de mando exige una cadena humana de responsabilidad. Y el propio plan de implementación de la OTAN vincula explícitamente los sistemas autónomos al uso responsable y al cumplimiento del derecho internacional.

Esto no significa que la IA en la guerra sea inofensiva, ni que estos principios no puedan erosionarse. La tensión entre velocidad y diligencia ética es real y creciente. La tentación de dejar que los algoritmos se hagan cargo de cada vez más partes del proceso de selección de objetivos, especialmente bajo la presión de la competición entre potencias similares, es enorme. Y la brecha entre los principios declarados y la práctica real podría ampliarse.

Pero a día de hoy, la arquitectura legal, doctrinal e institucional de las democracias occidentales hace que las armas totalmente autónomas (máquinas que deciden por sí solas quién vive y quién muere) no sean solo éticamente cuestionables, sino legalmente inadmisibles. La kill chain sigue requiriendo una mano humana. La pregunta es si tendremos la disciplina para mantenerla ahí.

Ya veremos.

Comparte:

14/2/26

Tinder, San Valentín y los patrones oscuros: Cuando el amor es un algoritmo tragaperras

febrero 14, 2026 No comments

Es 14 de febrero. Millones de personas entran hoy a una aplicación con la esperanza, o quizás la desesperación, de encontrar una conexión humana. Pero detrás de la interfaz limpia y colorida de Tinder, no hay un cupido digital trabajando para que encuentres el amor y borres la aplicación. Hay un casino. Y como en cualquier casino, la casa siempre gana cuando tú te quedas jugando, no cuando te llevas el premio y te vas.

Para entender por qué nos sentimos tan agotados pero incapaces de dejar de deslizar, hay que hablar de los "patrones oscuros", sobre los cuales ya hablé profundamente en este post. Este concepto de diseño se refiere a interfaces creadas meticulosamente no para ayudar al usuario, sino para explotar sus vulnerabilidades psicológicas. En el caso de Tinder y el ecosistema de Match Group, la estrategia es la "gamificación de la soledad".

El gesto de deslizar a la derecha o a la izquierda, conocido como el swipe, no es una decisión ergonómica inocente; es la traducción digital de la palanca de una máquina tragaperras. Tinder opera bajo un esquema de refuerzo intermitente variable. Si siempre encontraras gente fea, te irías. Si siempre encontraras gente guapa que te corresponde, encontrarías pareja y te irías. La aplicación te mantiene en un limbo calculado: te ofrece perfiles atractivos que te ignoran y perfiles que no te interesan, salpicados ocasionalmente con un "It’s a Match" que libera una dosis de dopamina exacta para mantenerte enganchado. La ansiedad de no saber cuál será la siguiente carta es lo que te mantiene en la mesa de juego.

Además, Tinder monetiza activamente la frustración. Utiliza patrones oscuros de ocultación de información para venderte sus planes Gold o Platinum. Te dice que "tienes 10 likes esperando", pero desenfoca las fotos, creando una brecha de curiosidad dolorosa. Te hace sentir invisible para venderte un "Boost". La lógica es perversa: su modelo de negocio entra en conflicto directo con su promesa de marca. Si son eficientes emparejándote, pierden un cliente recurrente. Por tanto, su éxito financiero depende de su fracaso amoroso.

Hace poco, en 2024, un grupo de usuarios intentó llevar esta realidad ante los tribunales en Estados Unidos, demandando a Match Group por diseñar un algoritmo depredador que fomenta la adicción compulsiva en lugar de las citas reales. Sin embargo, el pasado 13 de diciembre de 2024, la justicia bloqueó la demanda colectiva dando la razón a Match Group. ¿El motivo? La letra pequeña. La sentencia dictaminó que, al crear la cuenta de Tinder, todos estamos firmando una cláusula de arbitraje obligatorio que nos prohíbe ir a los tribunales ordinarios. Tinder no ganó demostrando que su app sea sana; ganó demostrando que ha diseñado una trampa legal perfecta para que no podamos quejarnos de su trampa psicológica.".

Aquí es donde la historia da un giro interesante y nos lleva al caso de ByteDance y TikTok. Seguro que os suena que también su algoritmo adictivo está teniendo problemas con la justicia:

La Comisión Europea acaba de publicar sus conclusiones preliminares contra TikTok. Apunta al “diseño adictivo” y concreta los mecanismos que lo articulan: scroll infinito, autoplay, notificaciones push, recomendador hiperpersonalizado. Según Bruselas, la aplicación "recompensa constantemente" a los usuarios con nuevo contenido, alimentando la urgencia de seguir haciendo scroll y poniendo el cerebro en modo piloto automático.

Señala además que TikTok ha ignorado indicadores importantes de uso compulsivo, como el tiempo que los menores pasan en la app por la noche o la frecuencia con la que la abren. La Comisión aboga por un cambio en el diseño básico del servicio: desactivar el scroll infinito progresivamente, implementar pausas efectivas —incluidas las nocturnas— y modificar el sistema de recomendación. TikTok ha respondido que las conclusiones presentan una descripción "categóricamente falsa" de su plataforma. No estamos ante la decisión final: ahora TikTok puede defenderse. Si se confirma la infracción, la DSA permite sanciones de hasta el 6% de la facturación global y exigir esos cambios en la aplicación.
Casi en paralelo, en California se ha iniciado el primer juicio civil contra Meta (Instagram), Google (YouTube) y ByteDance (TikTok) por la demanda de K.G.M., una joven de 19 años que afirma que su adicción a estas plataformas desde los ocho años le provocó depresión e ideación suicida. Lo central del caso no es qué vídeos vio, sino si el diseño mismo de estas plataformas (de nuevo, el scroll infinito, la reproducción automática, las notificaciones, los algoritmos de recomendación) constituye un “producto defectuoso” que causa daño.

(Blog Error500)

Si Tinder se ha librado, ¿por qué los titulares de las últimas semanas hablan de condenas y demandas masivas contra la empresa china por ser adictiva? ¿No hacen lo mismo?

La respuesta corta es que sí, hacen lo mismo, pero TikTok lo lleva a cabo con una "droga" más potente y, lo que es crucial, vendida a un público diferente. La justicia estadounidense ha puesto a ByteDance contra las cuerdas no solo por usar patrones oscuros, sino por aplicarlos a menores de edad. Mientras que a un adulto en Tinder se le supone responsabilidad propia, la ley considera que un niño de trece años no tiene las herramientas cognitivas para defenderse de un algoritmo diseñado por los mejores ingenieros conductuales del mundo.

Las investigaciones y los documentos internos revelados en el proceso contra TikTok han mostrado lo que los fiscales llaman la "pistola humeante": la empresa sabía que su diseño de scroll infinito impedía que el cerebro humano encontrara un punto de parada natural. Sabían que las notificaciones estaban diseñadas para interrumpir el sueño y sabían, de forma interna, que sus supuestas herramientas de "límite de tiempo" eran poco más que teatro de seguridad, ineficaces y fáciles de ignorar. A diferencia del caso de Tinder, aquí no se juzga la frustración de un usuario, sino el daño deliberado al desarrollo cerebral de una generación y la crisis de salud mental derivada de ello.

TikTok ha sido señalada porque su algoritmo de "interés" es mucho más agresivo y rápido aprendiendo vulnerabilidades que el de cualquier otra red social, actuando como una inyección directa de estímulos sin fricción. Además, no podemos ignorar el factor geopolítico; es mucho más fácil para un fiscal estadounidense atacar a una empresa china que a una local, aunque eso está cambiando.

Source

De hecho, sería un error pensar que esto es una cruzada exclusiva contra TikTok. Meta, la matriz de Instagram y Facebook, enfrenta una demanda conjunta de cuarenta y un estados que es, en esencia, idéntica a la de ByteDance. Se les acusa de haber copiado esos mismos mecanismos adictivos a sabiendas del daño que causaban a los adolescentes, priorizando el crecimiento sobre la seguridad. Por otro lado, Tinder y su matriz, tienen otros problemas bastante serios en la UE por la no-explicabilidad de su algoritmo, pero de eso hablaremos próximamente.

En este San Valentín, la lección que nos deja el panorama legal y tecnológico es clara. Tinder puede seguir jugando con tu soledad porque la ley asume que eres un adulto capaz de marcharte del casino cuando quieras, aunque psicológicamente sea una trampa. Pero cuando esa misma lógica de casino se aplica a los niños en TikTok, la sociedad ha decidido trazar una línea roja. Al final, todos somos ratones en un laberinto digital, solo que algunos laberintos tienen la puerta cerrada con llave y otros simplemente nos han convencido de que no queremos salir.

Comparte:

2/2/26

El alcalde de Londres y el fin de los empleos de niveles junior

febrero 02, 2026 No comments

Era una fría tarde de jueves a mediados de enero de 2026 cuando el alcalde de Londres, Sadiq Khan, se subió al estrado de Mansion House y lanzó una bomba retórica que silenció la sala. No habló de la crisis de la vivienda ni de las huelgas de transporte. En cambio, miró a la élite financiera de la ciudad y calificó la inteligencia artificial como un potencial «arma de destrucción masiva para el empleo».

Era el tipo de titular sensacionalista que encanta a los políticos, pero, por una vez, los datos sugieren que podría estar minimizando la situación. Khan advirtió que Londres se encuentra en el «borde más afilado» de un cambio que amenaza con acabar con la economía de cuello blanco, y anunció la creación de un «grupo de trabajo de IA» de emergencia para intentar detener la hemorragia. Pero mientras el alcalde habla en tiempo futuro sobre una crisis inminente, los sectores financiero y tecnológico ya han comenzado silenciosamente la demolición.

Fuente

Si quieres ver el alcance de la explosión, no mires al Ayuntamiento. Mira los balances de las empresas más grandes del mundo. Apenas unos días antes del discurso de Khan, Goldman Sachs publicó un escalofriante informe en el que advertía de que los despidos por «eficiencia impulsada por la IA» que vimos en 2025 eran solo el preludio. Sus analistas predicen que en 2026 se producirá una «nueva ola» de recortes, no porque la economía se esté hundiendo, sino porque es lo suficientemente estable como para que las empresas finalmente lleven a cabo la «reestructuración» que llevan años planeando.

Las pruebas se acumulan a una velocidad brutal. Amazon comenzó el año 2026 eliminando 16.000 puestos corporativos, una medida que, según los expertos, supone un giro directo hacia operaciones más ágiles y potenciadas por la IA. Google siguió la tendencia y recortó cientos de puestos de trabajo en sus unidades globales de negocio y nube, citando específicamente las «ganancias de eficiencia» de sus nuevos modelos de IA. No se trata de empresas en crisis, sino de empresas que se están optimizando para un futuro en el que los seres humanos son el pasivo más caro del balance.

Pero lo más insidioso de esta historia no es quién está siendo despedido, sino quién no está siendo contratado.

En lo más profundo de los debates técnicos de la blogosfera de Substack, voces como la de Gergely Orosz (The Pragmatic Engineer) están documentando un fenómeno más específico y aterrador. Se le llama «la muerte del desarrollador junior».

Durante décadas, la industria tecnológica funcionó con un modelo de aprendizaje sencillo. Se contrataba a recién graduados que no sabían nada, se les pagaba para que arreglaran pequeños errores y redactaran documentación, y cinco años después, se tenía un ingeniero senior. Era una inversión cara e ineficaz, pero era la única forma de formar talento.

Esa escalera ha sido eliminada. A finales de 2025 y principios de 2026, la contratación para puestos de ingeniería de nivel inicial se desplomó casi un 60 % en algunos sectores. La lógica es implacablemente simple: un agente de IA como GitHub Copilot o Claude ahora puede generar código repetitivo, escribir pruebas y depurar errores más rápido y más barato que un graduado de 22 años. El «trabajo pesado» que solía enseñar a los jóvenes cómo ser veteranos se ha automatizado.

Estamos asistiendo a la creación de una «brecha de aprendizaje». Los ingenieros sénior se están convirtiendo en superhumanos, utilizando la IA para hacer el trabajo de tres personas, lo que justifica la congelación de las contrataciones. Pero esto crea una bomba de relojería demográfica. Si hoy nadie contrata a jóvenes, en 2030 no habrá sénior. Estamos, en efecto, comiéndonos nuestras propias semillas, cambiando la mano de obra futura por ganancias de eficiencia trimestrales.

Esta es la «destrucción» que preocupa a Sadiq Khan, aunque quizá no se da cuenta de lo quirúrgica que es en realidad. No solo estamos perdiendo puestos de trabajo, sino también el camino hacia la competencia. El peligro no es que los robots nos sustituyan a todos mañana. El peligro es que estamos construyendo una «economía de barra»: una pequeña élite de arquitectos que manejan la IA en la cima, una enorme clase baja de trabajadores temporales que verifican los resultados de la IA en la base y absolutamente nada en el medio.

Mientras miramos fijamente hacia 2026, la pregunta no es si estamos preparados para el futuro. Es si ya estamos viviendo en el pasado. El arma ha sido detonada, las consecuencias son invisibles y el único mensaje de error que recibimos es «Puesto de nivel inicial: cerrado».

Ya veremos.

Comparte:

16/12/25

¿Por qué estoy en contra del aprendizaje personalizado con la IA?

diciembre 16, 2025 No comments

En 2013, Max Ventilla, un ejecutivo estrella de Google, decidió que el sistema educativo era un algoritmo ineficiente que necesitaba ser refactorizado. Su solución fue AltSchool. Con 170 millones de dólares en capital de riesgo (respaldados por Mark Zuckerberg y Peter Thiel), AltSchool prometió el santo grial de la educación: la personalización total a través del Big Data.

Las aulas de AltSchool parecían el sueño húmedo de un ingeniero de visión por computador. Cámaras y micrófonos grababan cada interacción. Sensores rastreaban el movimiento. Los estudiantes no seguían un currículo; seguían "listas de reproducción" (playlists) generadas por software. La promesa era seductora: usar la misma tecnología que recomienda tu próxima serie en Netflix para recomendar tu próxima lección de matemáticas.

En 2019, AltSchool cerró sus puertas, admitiendo que el modelo era "económicamente insostenible" y pedagógicamente cuestionable. Los padres se quejaron de que sus hijos pasaban el día mirando pantallas; los profesores sufrieron un burnout masivo intentando alimentar a la máquina de datos.

¿Por qué falló una de las startups mejor financiadas de la historia EdTech? Porque cometieron el error clásico de la ingeniería aplicada a las humanidades: confundieron la optimización de la eficiencia con el acto de educar.

El Sueño Aristócrata y la Falacia de la Escala

La obsesión con el "Aprendizaje Personalizado" no es nueva. De hecho, es la forma más antigua y elitista de educación.

Piensen en John Stuart Mill o en Alejandro Magno. Ellos tuvieron la versión original del aprendizaje personalizado: un tutor humano experto (su padre o Aristóteles, respectivamente) dedicado enteramente a ellos. El tutor conocía sus debilidades, adaptaba el tono a su estado de ánimo y aceleraba o frenaba según la curiosidad del alumno.

El objetivo de la tecnología educativa (EdTech) siempre ha sido noble: democratizar ese privilegio aristocrático. Escalar a Aristóteles. Si pudiéramos darle a cada niño pobre un tutor digital en su bolsillo, cerraríamos la brecha de desigualdad.

HackEducation

Pero aquí es donde la industria nos vendió gato por liebre. Lo que Silicon Valley llama "personalización" hoy en día no es un tutor socrático. Es, en palabras de los investigadores Neil Selwyn y Caroline Pelletier, una estandarización disfrazada.

El software no te permite explorar caminos divergentes (como haría un tutor humano). El software optimiza la ruta más rápida entre el punto A (ignorancia) y el punto B (pasar el test). Si tardas más, el sistema no asume que estás reflexionando; asume que eres un bug en el proceso de ingestión de datos.

La Torre de Babel Semántica

Si preguntas a cinco ingenieros qué es el "Aprendizaje Personalizado", obtendrás cinco respuestas diferentes. Una revisión sistemática reveló un caos absoluto: la industria usa indistintamente términos como "adaptativo", "individualizado" y "personalizado".

Paradójicamente, el pasado mes de noviembre se produjo un repentino aumento de las búsquedas en Google de términos relacionados con la «educación personalizada», probablemente debido al anuncio de ChatGPT para educadores.

Es realmente curioso cómo Bill Gates ha definido el aprendizaje personalizado a lo largo de los últimos años.

La cruda realidad técnica es esta: el 90% de lo que se vende como "IA Personalizada" es simplemente instrucción individualizada. Es el mismo menú para todos los comensales, la única diferencia es que unos lo mastican rápido y otros lento. No hay adaptación real del contenido ni del método, solo del ritmo. Es el fordismo aplicado a la mente, pero con una interfaz de usuario más bonita.

Para entender por qué la EdTech moderna se siente tan fría, tenemos que mirar bajo el capó, hacia un paper que cambió la industria para siempre.

Hasta 2015, los sistemas de tutoría inteligente usaban modelos estadísticos transparentes (como el Bayesian Knowledge Tracing), basados en teorías cognitivas sobre cómo aprendemos. Pero en la conferencia NeurIPS 2015, Chris Piech y su equipo de Stanford presentaron el artículo titulado "Deep Knowledge Tracing".

Propusieron usar Redes Neuronales Recurrentes (LSTMs) para modelar el conocimiento del estudiante. Al alimentar a la red neuronal con millones de datos de aciertos y fallos, el modelo "Deep Learning" logró predecir con una precisión asombrosa (un 25% mejor que los modelos anteriores) si un estudiante fallaría la siguiente pregunta.

Desde el punto de vista de Computer Science, fue un triunfo. Pero desde el punto de vista pedagógico, fue una tragedia.

Al pasar al Deep Learning, convertimos al estudiante en una "caja negra". El sistema representa el conocimiento del alumno como un vector de números en un espacio latente de alta dimensión. La máquina sabe que vas a suspender, pero matemáticamente no puede decirnos por qué. ¿Es por falta de atención? ¿Por dislexia? ¿Por un mal concepto base? El vector no tiene explicabilidad.

Pasamos de intentar entender la mente del estudiante a simplemente predecir su comportamiento click a click. Ganamos eficiencia predictiva, pero perdimos la capacidad de diagnóstico humano.

Educase

La Realidad: El Profesor como Gestor de Datos

La narrativa de ventas, impulsada por figuras como Bill Gates, es que la IA "liberará" a los profesores de las tareas repetitivas para que puedan "conectar" con los alumnos. La realidad en las aulas es la opuesta.

Al introducir estas plataformas de caja negra, no hemos liberado a los docentes; los hemos convertido en técnicos de soporte de IT y analistas de datos de bajo nivel. En lugar de mirar a los ojos a un alumno para detectar si está triste (algo que ningún LSTM puede vectorizar), el profesor pasa la clase mirando dashboards que le dicen quién está en rojo y quién en verde.

El aprendizaje real es un proceso caótico, social y profundamente ineficiente. Requiere tropezar, divagar y conectar emocionalmente. Al intentar "optimizar" la educación como si fuera una cadena de suministro, AltSchool y sus sucesores olvidaron la lección más importante de la computación:

Hay cosas que son features, no bugs. La necesidad humana de conexión, la imprevisibilidad de la curiosidad y la lentitud del pensamiento profundo no son problemas de latencia que debamos eliminar. Son la razón por la que aprendemos.

Mientras sigamos intentando codificar a Aristóteles en una red neuronal, seguiremos fracasando. La verdadera educación personalizada escalable no vendrá de un mejor algoritmo, sino de usar la tecnología para potenciar, y no reemplazar, la ineficiente y maravillosa conexión humana.

Conclusión

Lo que yo creo es que el camino a seguir para la tecnología educativa (o cualquier software para usar en clase, independientemente de si persigue el aprendizaje personalizado) debería ser combinar la experiencia del profesor, por ejemplo, en motivar a los alumnos y evaluar ideas complejas, con la capacidad de la tecnología para hacer cosas como ampliar las clases, involucrar a los alumnos en prácticas espaciadas y repetitivas, y aplicar reglas de forma coherente para que la calificación sea justa. Además, los profesores deberían recibir formación en el uso de las nuevas tecnologías. Antes de adoptar nuevas tecnologías educativas, los educadores deberían investigar cómo la tecnología personaliza la experiencia de aprendizaje, cómo construye la memoria a largo plazo, cómo favorece la atención y qué pruebas hay sobre su eficacia.

Ya veremos.

Comparte:

17/11/25

El Drone de Reparto: De la Promesa de Amazon a la Cruda Realidad de los Balances

noviembre 17, 2025 No comments

Dicen que el futuro de la logística es silencioso, sobrevuela el tráfico y llega a tu puerta en media hora. La visión de Amazon Prime Air, Walmart o Wingcopter prometiendo la entrega de última milla con drones (ese paquete de cinco libras o menos que te saca de un apuro) es, sin duda, seductora. Es la quintaesencia de la eficiencia: evitar el colapso urbano, reducir las emisiones en un 80-85% por paquete respecto a un vehículo de combustión, e ignorar los atascos.

En el corazón de esta transformación se encuentran gigantes del comercio minorista y la logística, como Amazon y Walmart, que han invertido considerablemente en la materialización de esta utopía aérea. El proyecto más emblemático, Amazon Prime Air, fue concebido no solo como una mejora logística, sino como un intento radical de redefinir el comercio electrónico, ofreciendo un servicio de entrega instantánea inigualable. Jeff Bezos postuló, ya en 2013, que ver drones de Amazon sería tan común como ver camiones de correos en la carretera.

Pero si el modelo es tan brillante, ¿por qué no estamos ya enterrados bajo un manto de drones zumbadores? La respuesta no está en la tecnología, sino en la regulación y, más crudamente, en la economía de la unidad operativa.

Para diseccionar esta brecha entre la promesa y la rentabilidad, no se me ha ocurrido nada mejor que analizar el modelo de negocio y resultados financieros de una empresa cotizada en Bolsa (en este caso, canadiense) que está luchando en esta arena: Volatus Aerospace Inc. (TSXV: FLT). Sus estados financieros y su estrategia revelan los desafíos que gigantes como Amazon o DHL deben superar para que sus proyectos de reparto sean algo más que costosos ejercicios de marketing. Es importante conocer que Volatus Aerospace es el resultado de la fusión que culminó en 2024, entre dos empresas del sector: Drone Delivery Canada (DDC) y Volatus Aerospace, de cuyo resultado nació Volatus Aerospace Inc.

Este post será un poco más largo que los habituales, pero pretendo demostrar en qué punto de este escenario tecnológico de ciencia ficción estamos, y más allá de los grandes titulares, cómo se puede hacer una empresa de reparto de mercancías con drones, alcance la tan deseada rentabilidad. Y sobre todo, ¿cómo se justifica este comportamiento en Bolsa de la acción de Volatus, capaz de estremecer a los inversores más calmados?

El cuello de botella regulatorio: la clave del negocio

El obstáculo principal de la logística con drones es el requisito de la Línea Visual (VLOS). Durante años, la normativa exigía que un operador mantuviera el control visual directo de su aeronave. Esto limita las misiones a distancias cortas y obliga a tener un operador por dron (o, con suerte, por un puñado de drones en una zona pequeña), disparando el coste operativo.

La verdadera viabilidad económica y la escalabilidad del negocio residen en el BVLOS (Beyond Visual Line of Sight).

Volatus Aerospace ha logrado convertir esta dificultad en su principal ventaja competitiva. Han obtenido un Certificado de Operaciones de Vuelo Especial (SFOC) de Transport Canada que autoriza operaciones BVLOS escalables a nivel nacional.

Su secreto está en la tecnología de Detección y Evitación (DAA). Volatus utiliza una integración de tres componentes:
1. Radar MatrixSpace: Un sistema ligero que detecta aeronaves pequeñas y no cooperativas (otros drones).
2. Kongsberg IRIS Terminal: Una plataforma de software para la conciencia del espacio aéreo.
3. Operations Control Center (OCC): Un centro neurálgico para la gestión remota.

Al certificar un sistema DAA robusto, Volatus ha convencido al regulador de que la seguridad ya no depende del ojo humano, sino de la tecnología, permitiendo a la empresa reducir drásticamente la proporción de personal por dron. Esto es lo que se traduce en rentabilidad.

Tal y como mencionaba antes, Volatus se fusionó con Drone Delivery Canada (DDC) para consolidar el mercado canadiense. DDC se centraba en la logística y entrega de mercancías autónoma, especialmente en el suministro a comunidades y áreas remotas del norte de Canadá. La lógica de esta consolidación es simple: en un sector donde la regulación es la barrera más alta, la unión de permisos regulatorios y la eficiencia del capital son las estrategias de supervivencia.

La principal debilidad de DDC y de la industria en general era el complejo y lento marco regulatorio que impide una rápida escalabilidad, junto con los altos costos iniciales. Sus gastos operativos superan los ingresos, resultando en pérdidas netas continuas.

Al unirse a Volatus, DDC pudo combinar su tecnología propietaria (software FLYTE, drones como el Sparrow) y su enfoque en nichos rentables (suministros médicos y carga de alto valor/urgente en comunidades remotas) con la ventaja regulatoria BVLOS y la infraestructura OCC certificada de Volatus. La fusión consolida un liderazgo regulatorio y tecnológico en el nicho geográfico canadiense. De hecho, Volatus es especialista en la entrega de paquetería en zonas de difícil acceso y poblaciones mal comunicadas, precisamente, el nicho que más sentido cobra en este negocio.

Lección para los Gigantes (Amazon, UPS): El moat de la logística aérea no es el dron más rápido, sino la certificación regulatoria y la infraestructura tecnológica DAA que permite la automatización total.2 Aunque la FAA ha aumentado las exenciones BVLOS (190 a octubre de 2024, frente a solo 6 en 2020) 5, el camino hacia una operación verdaderamente escalable y sin observadores visuales fuera de sitios de prueba designados sigue siendo lento y complejo.

El negocio real: cuando los sueños se estrellan contra el excel

Un error común es asumir que la rentabilidad vendrá solo del reparto de paquetes de última milla. Los documentos de Volatus revelan una estrategia de negocio diversificada, diseñada para generar flujo de caja mientras se construye la infraestructura BVLOS de alto valor.

Volatus Aerospace no es Amazon. Es una empresa canadiense-americana que opera en tres frentes: vende drones de otros fabricantes, ofrece servicios aéreos (inspecciones, vigilancia, transporte) y forma pilotos. En el segundo trimestre de 2025 facturaron 10,6 millones de dólares canadienses. Para ponerlo en perspectiva: Amazon gasta más que eso en café corporativo cada semana.

Pero precisamente por ser pequeña, Volatus nos muestra la anatomía económica del sector sin el maquillaje de las grandes corporaciones. Y los números son brutales.

El margen bruto del 32% que consiguieron en Q2 2025 esconde dos realidades muy distintas. Los servicios aéreos (vuelos de inspección, transporte de carga) generan márgenes entre el 40% y el 50%. Respetable. Rentable, incluso. Pero la venta de equipos (drones físicos) apenas roza el 20-25%, típico de cualquier negocio de distribución.

Y aquí viene lo interesante: en el trimestre analizado, el 48% de sus ingresos vino de vender cacharros, no de volar. ¿Por qué? Porque las guerras —concretamente, la demanda de la OTAN por drones militares tras la invasión rusa de Ucrania— han disparado las ventas de hardware. Volatus vendió un 114% más de equipos que el año anterior. Pero ese boom defensivo no dice nada sobre la viabilidad del reparto comercial.

El agujero negro operativo

Aquí está el problema estructural que Amazon no cuenta en sus keynotes: Volatus perdió casi 4 millones de dólares en el trimestre. Y no es una startup quemando capital para crecer: llevan operando desde 1987 (originalmente como empresa de aviación tripulada). Han volado 75.000 horas. Tienen certificaciones regulatorias que Amazon pagaría millones por conseguir. Y aun así, pierden dinero.

Desglosemos sus gastos operativos trimestrales:

Personal: 2,2 millones
Costes de oficina: 714.000
Marketing y publicidad: 428.000
Partners externos: 473.000
Depreciación: 1,4 millones

Sumemos: 5,6 millones en costes operativos contra 3,4 millones de beneficio bruto. Pérdida operativa: 2,2 millones. ¿Se entiende ahora la gráfica de la cotización de Bolsa?

Pero lo fascinante está en la nota a pie en los documentos financieros de la compañía: "certain costs increased due to termination expenses, legal fees". Traducción: están despidiendo gente y peleando en tribunales mientras intentan ser rentables. Y también es revelador un dato en la página 13 de estos documentos financieros: comparando con el mismo periodo de 2024 (sumando las dos empresas que se fusionaron para crear Volatus), redujeron gastos operativos en 2,7 millones. Es decir, están adelgazando brutalmente la estructura para no desangrarse.

Veamos los costes estructurales que Volatus nos revela:

Gasto operativo: Gastaron 411.000 dólares en seis meses solo en equipamiento. Cada dron cuesta entre 50.000 y 300.000 dólares según capacidad. Se deprecian en 3-5 años. Se estrellan. Requieren mantenimiento constante.

Operaciones remotas: Volatus presume de su Operations Control Center (OCC) en Toronto, que supervisa vuelos BVLOS remotamente. Suena eficiente hasta que piensas que necesitas operadores humanos certificados monitorizando pantallas. A diferencia de un algoritmo que escala gratis, cada operador cuesta 60.000-100.000 dólares anuales y puede supervisar quizá 10-20 drones simultáneos en el mejor escenario.

Infraestructura: Volatus tiene dos productos patentados: DroneSpot™ (zonas de aterrizaje) y Aeriport (estaciones de carga automática). Cada ubicación requiere inversión física, permisos, electricidad, conectividad. Esto no escala como abrir una cuenta de AWS.

Regulatorio: Las 75.000 horas de vuelo de Volatus les han costado años de trámites, SFOCs (Special Flight Operating Certificates) negociados caso por caso, relaciones con Transport Canada. En EE.UU., la FAA es mucho más restrictiva. Amazon lleva años en "pruebas piloto" porque cada nueva ruta requiere aprobación individual.

Y aquí viene una interesante paradoja: Volatus está cerca de ser rentable precisamente porque NO hace lo que Amazon promete.

Su EBITDA ajustado mejoró un 85% interanual: de perder 1,85 millones a perder solo 276.000 dólares en el trimestre. ¿Cómo? No con reparto urbano masivo, sino con:

- Inspecciones industriales de alto valor: Oleoductos, líneas eléctricas, parques solares. Facturaron la inspección de 760.000 paneles solares en Norteamérica. Una empresa de energía paga 200.000-500.000 dólares por un contrato de inspección que con helicópteros tripulados costaría el doble o triple.
- Ventas B2B de equipos: El 48% de sus ingresos viene de vender drones a gobiernos y empresas. Son un distribuidor especializado, no un operador puro. Amazon nunca hará esto.
- Formación: Han entrenado 114.000 pilotos desde su inicio. Es negocio de margen alto y recurrente. ¿Amazon va a montar academias de pilotos?
- Servicios de defensa: La guerra de Ucrania les disparó la demanda. Drones de vigilancia para militares. Esto es geopolítica, no logística.

¿Qué tienen en común estos negocios? Densidad de valor sobre volumen. Un contrato de inspección de 300.000 dólares con 50 vuelos es viable. Cincuenta entregas de 15 dólares cada una (750 dólares) con la misma infraestructura, no.

Ahora viene la parte que explica por qué Amazon sigue jugando a esto sin resultados. Volatus ha levantado capital desesperadamente:

Mayo 2025: 3 millones
Junio 2025: 5 millones
Julio 2025 (post-trimestre): 10 millones
Agosto 2025: 4,8 millones adicionales

Total: 22,8 millones en tres meses. ¿Para qué? Para no quedarse sin liquidez mientras buscan la rentabilidad.

Miren su estructura de capital: tienen 85,4 millones de warrants (opciones de compra) con precio de ejercicio entre 0,20 y 0,30 dólares. La acción cotiza alrededor de 0,50 dólares. Están diluyendo brutalmente a los accionistas para sobrevivir. Es decir, cada vez emiten más acciones al mercado, y eso hace que las que ya están en él pierdan valor. Están inundando de acciones, y eso no gusta nada a los accionistas (¿se sigue entendiendo ahora la gráfica de la cotización?). Su deuda a largo plazo asciende a 19,7 millones, con préstamos al 12,5-15,5% de interés de inversores privados y el gobierno de Quebec.

Compare esto con Amazon. Bezos puede quemar 500 millones anuales en Prime Air sin pestañear porque Amazon Web Services genera 90.000 millones al año. Prime Air es marketing, es señalización al mercado. No necesita ser rentable nunca.

Pero Volatus, como cualquier empresa normal, tiene que dar beneficios o morir. Y precisamente eso hace su caso tan ilustrativo: están haciendo lo máximo posible con la tecnología actual, las regulaciones reales y las economías de escala alcanzables. Y aun así, apenas sobreviven.

Lecciones de un Sector que Nunca Despegó

La historia de los drones de reparto comercial es una fábula moderna sobre la diferencia entre el bombo tecnológico y la viabilidad económica. No es que la tecnología no funcione: funciona, como Volatus demuestra con sus 75.000 horas de vuelo. Es que los números no funcionan.

El sector del dron comercial será real. Pero será en:

Inspecciones industriales (ya es rentable)
Respuesta a emergencias (valor infinito del tiempo)
Logística rural extrema (donde no hay alternativas)
Aplicaciones militares (presupuestos ilimitados)
Monitorización agrícola (Volatus acaba de firmar contratos nacionales en esto)

No será en entregarle a usted unas pilas en 30 minutos porque se le olvidó comprarlas.

Volatus Aerospace, con sus pérdidas trimestrales y sus rondas de financiación desesperadas, es más honesta que cualquier presentación de Walmart o Amazon. Sus estados financieros son la radiografía de una industria que prometió el futuro y entregó nicho.

La próxima vez que vean un anuncio de drones de reparto, acuérdense de los 276.000 dólares que Volatus sigue perdiendo cada trimestre haciendo exactamente eso, pero con clientes reales, reguladores reales y física real.

El futuro del transporte de carga con drones es prometedor, pero es un juego de alto riesgo y de gran capital. La lección de Volatus es clara: el negocio despegará primero en los mercados verticales de alta demanda (inspección y defensa), y solo después, de forma silenciosa y eficiente, se expandirá a tu buzón. La rentabilidad no es un sprint de marketing, sino una maratón de certificación BVLOS y ejecución de contratos.

El futuro llegó. Solo que no era rentable.

Ya veremos.

Comparte:

15/9/25

¿Los LLMs realmente nos entienden? La pregunta del millón en inteligencia artificial

septiembre 15, 2025 No comments

Este artículo va a ser más largo que de costumbre. Desde el comienzo del curso, me he vuelto a meter en la rueda del hámster de las noticias sobre inteligencia artificial y he dedicado bastante tiempo a leer algunos artículos científicos aparecidos en verano y otros contenidos igual de interesantes. Por todo ello, en parte para ordenar mis propias ideas y también para escribir el mejor contenido que puedo para mis avezad@s lectores, este artículo está dedicado al dilema científico sobre si los LLM nos entienden realmente cuando nos hablan o les hablamos.

Cuando chateas con ChatGPT, Claude o cualquier otro modelo de lenguaje, es natural preguntarse: ¿realmente me está entendiendo lo que digo (mi ironía, lo que he omitido, el razonamiento al que quiero llegar)? ¿Hay algo ahí dentro procesando mis palabras con comprensión genuina, o solo estoy interactuando con una máquina muy sofisticada que repite patrones estadísticos?

Esta pregunta va al corazón de uno de los debates más fascinantes en tecnología actual, y para mí la respuesta honesta es: no lo sabemos con certeza.

Lo que sabemos que hacen los LLMs

Los modelos de lenguaje procesan texto prediciendo la siguiente palabra más probable en una secuencia, basándose en billones de ejemplos de texto humano. Antes de procesar cualquier cosa, un LLM divide tu texto en pequeñas unidades, llamadas tokens. Un token puede ser una palabra completa ("gato"), una parte de ella ("gat-"), o incluso un signo de puntuación (","). Esta división inicial ayuda a manejar la enorme variedad del lenguaje de manera eficiente.

Después, cada token se convierte en un vector de embedding—una lista de cientos o miles de números. Estos números no son aleatorios; están diseñados para capturar el significado y el contexto del token. Las palabras con significados similares, como "perro" y "canino", tendrán vectores de embedding que están "cerca" uno del otro en este espacio matemático. Por el contrario, "perro" y "coche" estarán mucho más lejos. Este proceso es la base de cómo el modelo "entiende" la relación entre las palabras.

Cómo las palabras relacionadas tienen vectores más cercanos entre sí (HuggingFace)

La verdadera revolución no fue la conversión a vectores, sino lo que vino después: los transformers. Este tipo de arquitectura de red neuronal, introducida en 2017 por Google, es la base de casi todos los LLMs modernos.

Sin embargo, la parte más crucial de un transformador es su mecanismo de atención. Imagina que el LLM está leyendo una frase como: "El banco del parque es de madera". Para entender el significado de "banco," el modelo necesita saber que se refiere a un asiento, no a una institución financiera. El mecanismo de atención permite al LLM sopesar la importancia de cada token en relación con todos los demás tokens de la frase. Le dice al modelo: "Presta más atención a 'parque' que a 'madera' para entender qué tipo de 'banco' es." Este enfoque contextual es lo que hace que los LLMs sean tan buenos en la comprensión del lenguaje.

Una vez que el modelo ha procesado tu entrada a través de estas complejas capas, genera una nueva serie de vectores que representan la respuesta que va a producir. Luego, estos vectores se convierten de nuevo en tokens, que se unen para formar el texto final. Es un proceso de ida y vuelta: de palabras a números para procesar y de números a palabras para comunicar. Este tipo de algoritmos se denomina autorregresivo.

En resumen, los LLMs no "leen" como nosotros. Operan en un mundo de números y álgebra lineal, transformando la complejidad del lenguaje en patrones matemáticos. Y es en estos patrones donde reside su asombrosa capacidad para imitar, crear y "entender" el mundo humano.

El problema es que "entender" es un concepto escurridizo.

¿Entiendes realmente el español porque puedes procesarlo automáticamente, o porque tienes experiencias conscientes asociadas con las palabras? Los LLMs no tienen cuerpos, no experimentan el mundo físico, no tienen emociones o motivaciones intrínsecas. Su "comprensión" del concepto "calor" viene de patrones estadísticos en texto, no de haber sentido el sol en la piel. De hecho, la pregunta que podríamos hacernos nosotros de esto es si nuestros cerebros, desde niños, ¿son también entrenados de la misma forma? ¿Son las conexiones sinápticas que relacionan conocimientos y conceptos abstractos un paralelismo de lo que se hace con los grandes modelos de lenguaje?

La Habitación China de Searle: El argumento clásico contra la comprensión

En 1980, el filósofo John Searle propuso su famoso experimento mental de la "Habitación China". Imagina a alguien encerrado en una habitación con un libro de reglas para entender símbolos chinos. Puede responder preguntas en chino siguiendo las reglas, pero no entiende realmente el idioma. Searle argumenta que los LLMs son exactamente esto: sistemas que manipulan símbolos sin comprensión semántica genuina. Para él, los LLMs pueden simular comprensión, pero nunca alcanzarla verdaderamente porque carecen de intencionalidad y experiencia consciente.

De hecho, la comunidad científica está dividida y algunos consideran que los LLM son simples loros estocásticos.

La expresión "loro estocástico" se popularizó a partir del influyente artículo de 2021 titulado "On the Dangers of Stochastic Parrots: Can Language Models Be Too Big?", co-escrito por Emily M. Bender, Timnit Gebru, Angelina McMillan-Major y Margaret Mitchell. La metáfora se descompone en dos partes fundamentales. El término "loro" se utiliza para enfatizar la naturaleza imitativa y repetitiva de los modelos, sugiriendo que, al igual que un loro real, pueden producir un lenguaje coherente sin captar su significado real. Por su parte, "estocástico" se refiere a su naturaleza probabilística.

Los LLM funcionan prediciendo la siguiente palabra más probable en una secuencia de texto, un proceso que introduce un grado de aleatoriedad para evitar respuestas rígidas y mecánicas. La tesis central de este informe es que si bien la metáfora es útil para señalar deficiencias críticas, no logra capturar la complejidad de las capacidades que emergen a gran escala.

Fuente

Sin embargo, científicos como Yoshua Bengio y Geoffrey Hinton argumentan que la comprensión podría emerger de representaciones distribuidas suficientemente complejas. Y no solo eso, sino que investigaciones recientes usando técnicas de "interpretabilidad mecánica" han revelado que los LLMs desarrollan representaciones especializadas para conceptos específicos. Chris Olah y el equipo de Anthropic han documentado "neuronas" individuales que se activan para conceptos específicos como "Torre Eiffel" o "felicidad", sugiriendo algún tipo de comprensión estructurada.

Jason Wei y colaboradores de Google documentaron "habilidades emergentes" en LLMs grandes, de las que hablé en el último artículo: capacidades que aparecen súbitamente al alcanzar cierto tamaño, sin estar explícitamente programadas. Estas incluyen razonamiento matemático, traducción a idiomas no vistos en entrenamiento, y resolución de problemas complejos.

Dario Amodei, CEO de Anthropic, argumenta que estas emergencias sugieren que los LLMs han desarrollado representaciones del mundo que van más allá de simple memorización: "Cuando un modelo puede razonar sobre física básica sin haber sido entrenado explícitamente en física, algo profundo está ocurriendo".

Posiciones a favor y en contra

El científico jefe de IA de Meta, Yann LeCun, sostiene que los LLM son "herramientas especializadas" que operan en un espacio de lenguaje "simple, discreto y de baja dimensionalidad". Su argumento central es que los LLM carecen de una "representación del mundo" o "modelo mental" que permita a los humanos y los animales planificar y predecir las consecuencias de sus acciones en el mundo físico. LeCun destaca el "paradigma del bebé", señalando que los humanos adquieren una comprensión del mundo físico con una cantidad de datos visuales que sería equiparable a la de un LLM entrenado durante 400,000 años. Concluye que la AGI nunca se logrará simplemente escalando modelos entrenados con texto.

De hecho, otros investigadores de Apple recientemente han publicado un polémico artículo titulado La ilusión del pensamiento, en el que subrayan esta idea de que los LLM son reglas estadísticas super vitaminadas. Pero en mi opinión, el artículo deja un poco que desear por simplista y omisión de algunas otras evidencias que estoy tratando de describir en este post.

Por su parte, el crítico de IA Gary Marcus argumenta que los LLM operan a través del "reconocimiento de patrones" y no del "razonamiento genuino". Él aboga por un enfoque "híbrido" o "neurosimbólico" que combine la capacidad de reconocimiento de patrones del aprendizaje profundo con la lógica y las reglas explícitas de la IA simbólica. La propuesta de Marcus se alinea con el marco de Daniel Kahneman de los "Sistemas 1 y 2" del pensamiento, donde el aprendizaje profundo se asemeja al pensamiento rápido e intuitivo (Sistema 1) y necesita integrarse con un sistema lento y deliberativo (Sistema 2) para alcanzar una inteligencia robusta y confiable.

La crítica de LeCun y Marcus, a pesar de sus tensiones profesionales, converge en un punto crucial: la Inteligencia Artificial General, AGI, no es un problema de escala, sino un problema de arquitectura. Ambos sostienen que la arquitectura de los LLM, basada en la predicción de texto, tiene una limitación inherente en su incapacidad para desarrollar una comprensión causal y una representación interna del mundo físico.

Pero también existen argumentos bastante intuitivos a favor de que lo que hace ChatGPT o Claude no es un simple loro estocástico.

Los LLMs a veces cambian de opinión durante una conversación cuando se les presentan evidencia convincente. Este comportamiento de "ser persuadido" sugiere algún tipo de evaluación interna de la fuerza de argumentos, no simple generación de texto basada en frecuencias de entrenamiento.

Además, tal y como señala el filósofo Daniel Dennett, el acto mismo de argumentar implica una forma de "agencia" o autonomía. - la capacidad de tomar posturas evaluativas y defenderlas. Si los LLMs fueran verdaderamente loros estocásticos, no desarrollarían preferencias argumentativas o resistencia a ciertas proposiciones.

La metáfora del loro estocástico, aunque útil para señalar limitaciones importantes de los LLMs, puede ser reduccionista. Como argumenta Melanie Mitchell, los LLMs exhiben comportamientos que requieren explicaciones más sofisticadas que simple "repetición estadística sofisticada".

Quizás el modelo descrito al comienzo del artículo, el de adivinar la siguiente palabra, sea más poderoso de lo que nos imaginamos.

The-Decoder

Hacia un Futuro Híbrido: El Camino Hacia la AGI

El debate técnico sobre las capacidades de los LLM a menudo se reduce a una cuestión filosófica sobre la naturaleza misma de la "comprensión". Para enmarcar esta discusión, se puede recurrir a la distinción filosófica clásica entre el "sentido" y la "referencia". El "sentido" de una palabra se relaciona con el modo en que se presenta y su relación con otras palabras. La "referencia," por otro lado, es la conexión de la palabra con un objeto o experiencia en el mundo real. Un ser humano entiende la palabra "mesa" porque ha tenido experiencias sensoriales directas: la ha tocado, visto y experimentado su función. Un LLM, en cambio, entiende la palabra "mesa" a través de sus relaciones estadísticas con otras palabras en millones de textos. En este sentido, los LLM tienen una comprensión profunda del "sentido," pero carecen por completo de la "referencia" que ancla el lenguaje humano a la experiencia sensorial y subjetiva. Es la ausencia de esta experiencia subjetiva la que genera las alucinaciones y la falta de sentido común intuitivo.

El consenso emergente es que la AGI no se logrará únicamente con modelos cada vez más grandes y más datos de texto. La solución no reside en el escalado, sino en la integración de nuevas arquitecturas. El futuro de la IA probablemente se basará en "sistemas de agentes" que combinen las fortalezas de los LLM (procesamiento de lenguaje, formalización) con otras herramientas y arquitecturas que les proporcionen el anclaje en el mundo físico y las estructuras de razonamiento simbólico que actualmente faltan. La metáfora del "loro estocástico" no es el final del debate, sino el punto de partida para una conversación más matizada y rigurosa sobre cómo construir una inteligencia artificial que no solo hable, sino que también actúe y "entienda" el mundo de una manera verdaderamente significativa.

Comparte:

14/5/25

Cuando el aula se transforma en la nube

mayo 14, 2025 No comments

Hay algo extrañamente silencioso en la universidad moderna. No en las bibliotecas ni en las aulas, sino en su alma. Los rituales se mantienen: se imprimen los títulos, se asignan los planes de estudio, se envían los enlaces de Zoom. Pero bajo la superficie, algo está desapareciendo.

La educación ya no es un lugar. Se está convirtiendo en un proceso escalable, exportable y cada vez más automatizado. En todo el mundo, los estudiantes universitarios ven inútil asistir a clase.

En Silicon Valley llevan tiempo profetizando este cambio. La educación, argumentan, es un producto ineficaz, hinchado y que debería haber cambiado. ¿Por qué pagar 60.000 dólares al año por una experiencia en un campus cuando se puede seguir la misma clase en un teléfono estropeado en Yakarta? ¿Por qué pasar cuatro años en una residencia universitaria cuando la GPT-5 puede comprimir la lista de lecturas en un fin de semana?

Ya no son ideas marginales. La visión de la educación, respaldada por las empresas, es clara: desagregar el título, atomizar el plan de estudios, personalizar la experiencia. Sustituir al profesor por un instructor. Sustituir el aula por un panel de control. Sustituir al estudiante por un usuario.

Y para muchos, está funcionando.

Las universidades online están en auge: ofrecen títulos por una fracción del coste. En Estados Unidos, la deuda media de los estudiantes ronda los 37.000 dólares. A escala mundial, la educación superior es una industria de 2 billones de dólares. La lógica económica del aprendizaje digital es difícil de ignorar.

¿Pero la lógica cultural? Es más frágil.

Durante décadas, un título universitario no era sólo un certificado: era un símbolo. De ambición, de pertenencia, de movilidad ascendente. Pero los símbolos dependen de la escasez. ¿Qué pasará cuando los títulos sean tan comunes como el Wi-Fi? ¿Qué pasará cuando la distinción entre «enseñado» y «autodidacta» se convierta en semántica?

Ya estamos viendo señales. Los empleadores devalúan silenciosamente las credenciales. Los jóvenes se preguntan si un diploma sigue significando algo, si realmente significa algo. El contrato social se está deshilachando: paga la cuota, haz el trabajo y serás recompensado. Pero, ¿y si el trabajo lo hace la inteligencia artificial? ¿Y si la recompensa ya no es suficiente?

Y luego está la pregunta que nadie quiere formular en voz alta: ¿Qué estamos perdiendo en esta transición?

Es fácil decir que la educación se basa en el conocimiento. Pero cualquiera que haya pisado alguna vez un campus sabe que también se trata de fricción. Se trata de sentarse en aulas donde uno no es la voz más inteligente. Se trata de discusiones nocturnas, seminarios incómodos, política de cafetería. Se trata de aprender a hablar y, a veces, a callarse.

Eso no se puede descargar.

Hace más de cincuenta años, Ivan Illich advirtió que habíamos confundido escolarización con aprendizaje. En Deschooling Society, escribió:

«Se 'escolariza' así al alumno para que confunda la enseñanza con el aprendizaje, el ascenso de curso con la educación, el diploma con la competencia».

Illich soñaba con un mundo en el que las personas pudieran aprender libremente, sin pasar por instituciones. Irónicamente, la IA puede estar construyendo el sistema que él imaginó, pero sin libertad.

Estamos cambiando algo profundamente humano -la presencia compartida- por la eficiencia. Y quizá sea inevitable. Tal vez sea así como se ve el progreso: campus más silenciosos, sistemas más inteligentes, más «elección».

Pero me pregunto si algún día nos daremos cuenta de que no sólo hemos externalizado la educación, sino también la iniciación. Nos hemos quedado con la información y hemos perdido la transformación.

El aula del futuro no tendrá paredes. Puede que ni siquiera tenga profesores. Será rápida, receptiva y extrañamente silenciosa.

Pero en algún lugar de ese silencio, puede que empecemos a preguntarnos si alguna vez tuvo sentido aprender.

Ya veremos.

Comparte:

11/2/25

¿Debería el Gobierno alemán salvar a Lilium eVTOL de la quiebra?

febrero 11, 2025 No comments

Mientras que los LLMs, OpenAI, DeepSeek y todas estas empresas atraen la mayoría de los titulares hoy en día, me gustaría escribir este post y recordar una vez más, que los LLMs podrían no ser la única idea tecnológica a la que deberíamos prestar atención. Como muchos adivinaréis, apuesto fuerte por la revolución robótica que se avecina, y como una pequeña pieza de todos esos cambios, recordemos la situación del mercado de eVTOL (aerotaxis). En particular, la situación de Lilium.

En octubre de 2024 advertí en este blog que en el mercado eVTOL habría sangre.

Como puede leerse en el post anterior, Lilium se enfrentaba a la quiebra si no recibía un préstamo del Gobierno alemán. Dos semanas después, la empresa planeaba declararse insolvente y solicitar una reestructuración supervisada por el Gobierno, según una declaración presentada ante la Comisión del Mercado de Valores de Estados Unidos. Esto significa que Lilium se enfrentaba a un riesgo significativo de quiebra o cierre si no conseguía fondos adicionales.

La empresa había solicitado un préstamo de 50 millones de euros (54 millones de dólares) al Gobierno alemán, pero los legisladores denegaron la petición este mes, según la presentación. El mercado de eVTOL es un sector que requiere mucho capital. Las reglas de la competición eVTOL son sencillas: invertir todo el dinero que se pueda en conseguir la certificación necesaria para volar y la producción en serie -que ahora cuesta unos 1.500 millones de dólares-, y conseguir dinero de los inversores para seguir quemando efectivo. El primero que lo consiga, gana la partida.

El flujo de caja operativo fue de 159 millones de euros en el primer semestre de 2024. 100 millones de euros ni siquiera bastaron para cubrir un semestre. Es un gasto impresionante para una empresa que no genera beneficios. Lilium ha gastado casi 1.500 millones de euros desde el principio hasta la construcción de los primeros prototipos para la campaña de pruebas de vuelo.

Esto podría hacernos pensar que OpenAI no es rentable en absoluto. De hecho, podría ser un modelo de negocio horrible. Pero Microsoft y el Gobierno de EE.UU. tienen fe en mantener las pérdidas financieras de esta empresa hasta que alcance la AGI, que según el acuerdo entre Microsoft y OpenAI se logrará cuando la startup pueda generar al menos 100.000 millones de dólares de beneficios en un año.

Sin embargo, Lilium ha adoptado una estrategia peligrosa, culpando de su difícil situación financiera a la falta de apoyo de los gobiernos europeos. Argumentan que, a diferencia de sus homólogos estadounidenses o chinos, Europa no ofrece un apoyo adecuado a las nuevas empresas de alta tecnología. En consecuencia, la dirección afirma que las opciones de la empresa se reducen a la insolvencia o al traslado al extranjero.

Puede que sea cierto, pero no debemos descartar las voces críticas que también se han alzado sobre esta empresa alemana. Una de las voces técnicamente más firmes que he encontrado procede de Iceberg Research, una sociedad de inversión que identifica importantes tergiversaciones de beneficios e irregularidades contables en los estados financieros emitidos por empresas públicas. Similar a Gotham City, o a muchas otras. Cito aquí las palabras exactas del informe de Iceberg Research (en traducción libre personal):

Después de nueve años y un gasto de 1.500 millones de dólares, el avión de Lilium es incapaz de volar más de unos minutos.

Si se leen las relaciones públicas de Lilium, es fácil tener la impresión de que la empresa está muy cerca de comercializar su eVTOL. El bombardeo de relaciones públicas es una serie de grandes hitos, desde nuevos «clientes» y asociaciones, hasta una nueva línea de montaje, una «revolucionaria tecnología de baterías», etc. Todo parece listo.

Pero la pregunta es sencilla: «¿Durante cuánto tiempo puede volar ese eVTOL?». La respuesta es apenas cinco minutos y medio -sin pasajeros ni carga-, según los últimos datos disponibles. Después de nueve años y un gasto de 1.500 millones de dólares, Lilium ha construido lo que es esencialmente un gran dron de corto alcance. Esto es aún más problemático para una empresa que se ha posicionado como proveedor de transporte regional, más que como empresa de movilidad aérea urbana.

En cambio, su competidor Joby Aviation ha demostrado su capacidad para volar 154,6 millas en 1 hora y 17 minutos. En los últimos cuatro años, Joby ha realizado más de 1.500 vuelos de prueba, entre ellos unos 100 con piloto a bordo. Toyota se alegró de invertir otros 500 millones de dólares en Joby a principios de mes. Los inversores de Lilium, como Tencent o el vehículo de inversión del fundador de Skype, parecen cansados de verter dinero en este pozo sin fondo.

En el origen de estos problemas se encuentran las malas decisiones tomadas desde el principio, cuando unos pocos jóvenes licenciados eligieron ventiladores en conducto para la propulsión, mientras que la mayoría de sus colegas optaron por hélices. Numerosos expertos en aeronáutica criticaron desde el principio el diseño de los ventiladores en conducto, demasiado ambicioso para las baterías disponibles en la actualidad y en un futuro próximo. No se les dio importancia, pero el tiempo les ha dado la razón. Le sugiero que no pierda de vista este informe técnicamente asequible.

La historia de Lilium no es simplemente la de unos directivos demasiado optimistas que eligieron la tecnología equivocada. Ante el escepticismo sobre la autonomía de sus baterías, Lilium optó por engañar a sus inversores sobre las capacidades de sus baterías y parece bastante improbable que esas baterías cumplan las condiciones que la empresa promete.

Por otra parte, esta empresa eVTOL, con sus operaciones en Alemania y su registro holandés, se presenta como un candidato natural para recibir ayudas del gobierno europeo. Sin embargo, su accionariado está cada vez más dominado por la china Tencent Holdings.

Actualmente, Tencent posee el 22,0% de Lilium, y esa participación podría aumentar hasta el 38,1%, a través de 160,2 millones de warrants en circulación, que Tencent recibió a cambio de aportar 100 millones de dólares de financiación en mayo de 2023.

Sin embargo, ¡la historia continúa! El 24 de diciembre de 2024, Lilium anunció la firma de un acuerdo de compra de activos con Mobile Uplift Corporation GmbH, una empresa creada por un experimentado consorcio de inversores de Europa y Norteamérica. La empresa eVTOL esperaba obtener financiación suficiente para reiniciar sus operaciones comerciales. De hecho, se anunció que los nuevos accionistas tenían previsto invertir más de 200 millones de euros en la empresa insolvente.

Lamentablemente, en el momento de escribir estas líneas, todavía no se han pagado los salarios de enero de 2025 y el futuro de la empresa sigue siendo muy dudoso.

Ya veremos.

Comparte:

9/3/26

El mártir de los principios selectivos

La jugada de OpenAI: Groucho Marx en el Pentágono

¿Quién tiene razón?

2/3/26

¿Qué entendemos por "totalmente autónomo"?

La doctrina de la Kill Chain

Los propios principios éticos del Departamento de Defensa dicen que no

El muro del Derecho Internacional Humanitario

Ucrania: la prueba de realidad

La dimensión nuclear

Entonces, ¿dónde nos deja esto?

14/2/26

2/2/26

16/12/25

El Sueño Aristócrata y la Falacia de la Escala

La Torre de Babel Semántica

Conclusión

17/11/25

El cuello de botella regulatorio: la clave del negocio

El negocio real: cuando los sueños se estrellan contra el excel

El agujero negro operativo

Lecciones de un Sector que Nunca Despegó

15/9/25

Lo que sabemos que hacen los LLMs

La Habitación China de Searle: El argumento clásico contra la comprensión

Posiciones a favor y en contra

Hacia un Futuro Híbrido: El Camino Hacia la AGI

14/5/25

11/2/25

Nos leemos:

Recibe las entradas por correo

En mi mesilla

Blog Archive

Etiquetas

Blogroll

Licencia Creative Commons