La Ilusión del Pensamiento: análisis del paper de Apple sobre modelos razonadores

Tiempo de lectura: 3 minutos

Un reciente paper de Apple, titulado «The Illusion of Thinking» (la ilusión del pensamiento), ha provocado un intenso debate en la comunidad de inteligencia artificial. En él se cuestiona si los modelos razonadores realmente razonan o si simplemente simulan pensamiento.

A través de una serie de experimentos estructurados, el estudio apunta a las limitaciones inherentes de los modelos actuales, incluso cuando se les otorga tiempo extra para «pensar». Pero, ¿hasta qué punto son válidas sus conclusiones? Este artículo desglosa sus hallazgos, analiza las críticas y aporta una mirada contextual.

¿Qué analiza el paper de Apple?

El estudio de «La Ilusión del Pensamiento», se centra en evaluar el rendimiento de modelos razonadores como Claude 3, Gemini, GPT-4 o DeepSeek R1 usando juegos de lógica como las Torres de Hanoi o River Crossing. Estos problemas permiten escalar la complejidad fácilmente y medir la capacidad de razonamiento en condiciones controladas.

Apple compara versiones «razonadoras» de estos modelos (aquellos entrenados con test-time compute) con versiones estándar, para observar si dedicar más tokens al «pensamiento» mejora los resultados.

Principales hallazgos del estudio

 

  • El rendimiento cae con la complejidad, tanto en modelos razonadores como no razonadores.

 

  • El número de tokens de pensamiento no siempre aumenta con la dificultad: algunos modelos generan menos tokens ante retos complejos.

 

  • Se detecta overthinking: los modelos a veces generan la solución correcta al inicio, pero la desechan al seguir «pensando».

 

  • Incluso cuando se proporciona el algoritmo correcto en el prompt, los modelos fallan al ejecutarlo si el número de pasos es alto.

 

Críticas metodológicas

 

Algunos expertos han replicado los experimentos y han notado que, en muchos casos, el modelo simplemente interrumpe el razonamiento por longitud o complejidad, no por falta de comprensión.

Además, el uso de juegos específicos para probar razonamiento puede tener sesgos estructurales. Resolver Hanoi con 10 discos no es difícil desde el punto de vista conceptual, pero sí requiere una ejecución extensa y libre de errores.

Reflexión: ¿Limitación cognitiva o computacional?

 

El paper interpreta la caída en rendimiento como una limitación fundamental. Pero muchos analistas apuntan a un problema de capacidad técnica: los modelos actuales no están diseñados para ejecutar largas cadenas deterministas con precisión quirúrgica.

De hecho, el propio comportamiento de los modelos sugiere que entienden la tarea pero «deciden» no continuar por motivos prácticos, como coste computacional o límites de generación.

 

Implicaciones para la industria

 

El estudio invita a revisar el verdadero potencial de los modelos razonadores. Aunque el razonamiento paso a paso parece prometedor, no está exento de fricciones:

 

  • Razonamiento no es ejecución exacta: los LLM son estocásticos, no deterministas.

 

  • La calidad depende del contexto: prompts, longitudes y métricas influyen radicalmente.

 

  • No basta con dar tiempo para pensar: hace falta estructura, memoria de trabajo y control de errores.

Conoce los secretos de la inteligencia artificial y cambia tu carrera

Domina la creación de agentes de inteligencia artificial, crea flujos de trabajo eficientes e impulsa tu carrera.

Estudia Inteligencia Artificial

El paper de Apple abre una conversación valiosa, pero sus afirmaciones deben tomarse con cautela. No prueba que los modelos no razonen, sino que razonar con alta precisión bajo ciertas condiciones aún es un reto.

Como en muchas revoluciones tecnológicas, entender los límites actuales es esencial para superarlos. Si quieres formar parte de esta ola de innovaciones, nuestro Máster en Inteligencia Artificial es el camino perfecto para lograrlo.

Carlos Palmón
Carlos Palmón es Sociólogo, SEO Content Specialist y Marketing Analyst. Intrigado por entender la sociedad, se graduó en Sociología para entender mejor el mundo que nos rodea. Desde 2020, ayuda a conectar a las organizaciones con su público ideal, aunando su interés por el análisis sociológico, con su pasión por el copywriting, el SEO y la creación de contenidos. Actualmente, se especializa en Data Analytics para reforzar todavía más su capacidad de transformar datos en historias que conectan.
Más información
×