Informe del MIT: la mayoría de las organizaciones no se ven el retorno comercial de las inversiones de Gen AI
Un informe reciente fuera del MIT Media Lab descubrió que a pesar de los $ 30-40 mil millones en gastos empresariales en IA generativa, el 95% de las organizaciones no ven ningún rendimiento comercial.
Los autores del informe de julio de 2025, titulado «The Genai Divide: State of AI in Business 2025», escribieron: «Los resultados están tan rastreamente divididos entre ambos compradores (empresas, mercado medio, SMBS) y constructores (startups, proveedores, consultas) lo llamamos Divide de Gen AI,» solo que «solo el 5% de los pilotos integrados de AI es el valor de los pilotos de AI, los vendedores que se están extraciendo en el valor de los vegetones, lo que viene al valor de los vastadores, mientras que el valor de los vastadores de AI es el valor de los vastadores, mientras que el valor de los vastadores de AI es el valor de los vastadores, mientras que los vastadores, el valor de los vastadores, el 3%» son los pilotos de AI. permanecer atascado sin impacto medible de P&L «.
Lo que significa la ‘Gen Ai Divide’
La división se define por una alta adopción pero baja transformación. El informe dice que solo dos industrias muestran signos claros de interrupción estructural, mientras que otras siete muestran «experimentación generalizada sin transformación.
Respaldó esto con un índice de interrupción del mercado de IA e incluyó una cita de la entrevista de un director de operaciones de fabricación del mercado medio: «La exageración en LinkedIn dice que todo ha cambiado, pero en nuestras operaciones, nada fundamental ha cambiado. Estamos procesando algunos contratos más rápido, pero eso es todo lo que ha cambiado».
Piloto a producción: donde la mayoría de los esfuerzos se detienen
La evidencia más aguda de la división es el despliegue: «Solo el 5% de las herramientas de IA empresariales personalizadas alcanzan la producción». El informe caracterizó esto como una tasa de falla del 95% para las soluciones de IA empresariales y lo atribuye a flujos de trabajo frágiles, aprendizaje contextual débil y desalineación con las operaciones diarias. También registró el escepticismo del usuario sobre las ofertas de proveedores: «Hemos visto docenas de demostraciones este año. Tal vez uno o dos son realmente útiles. El resto son envoltorios o proyectos científicos».
Las empresas ejecutan la mayoría de los pilotos, pero convierten la menor cantidad; Las organizaciones del mercado medio se mueven más rápido de la implementación piloto a completa (~ 90 días) que las grandes empresas (nueve meses o más).
Números de adopción versus impacto comercial
Las herramientas de propósito general se exploran ampliamente, pero el impacto es limitado: «Más del 80% de las organizaciones han explorado o pilotado [ChatGPT/Copilot]y casi el 40% informa el despliegue, «Sin embargo, estos mejoran principalmente la productividad individual, no el rendimiento de P&L. Mientras tanto, el 60% de las organizaciones evaluaron los sistemas de grado empresarial,» pero solo el 20% alcanzó la etapa piloto y solo el 5% alcanzó la producción «.
La causa raíz: la brecha de aprendizaje
La explicación central del informe es que la barrera central es el aprendizaje en lugar de la infraestructura, la regulación o el talento: «La mayoría de los sistemas Genai no retienen la retroalimentación, se adaptan al contexto o mejoran con el tiempo».
Los usuarios a menudo prefieren las interfaces de consumo LLM para los borradores, pero las rechazan por el trabajo de la misión crítica debido a la falta de memoria y persistencia. Un entrevistado explicó: «Es excelente para la lluvia de ideas y los primeros borradores, pero no retiene el conocimiento de las preferencias del cliente ni aprende de ediciones anteriores. Repite los mismos errores y requiere una amplia entrada de contexto para cada sesión. Para el trabajo de alto riesgo, necesito un sistema que acumula conocimiento y mejore con el tiempo».
El informe resumió esta brecha sucintamente: «Las mismas limitaciones de Chatgpt revelan el problema central detrás de la división de Gen AI: Olvidan el contexto, no aprende y no puede evolucionar». Para tareas complejas y más largas, los humanos siguen siendo la fuerte preferencia.
Shadow AI: los trabajadores cruzan la división informalmente
Mientras que los programas oficiales retrasan, ha surgido una «economía de IA en la sombra»: «Solo el 40% de las empresas dicen que compraron una suscripción oficial de LLM», sin embargo, los trabajadores de más del 90% de las compañías informaron un uso regular de herramientas personales de IA para el trabajo. Este patrón muestra que las personas pueden cruzar la división con herramientas flexibles incluso cuando las iniciativas empresariales se detienen.
Por qué esto importa
Para los equipos encargados de operacionalizar la IA en entornos en la nube, el informe indicó que el cuello de botella se encuentra en los sistemas que pueden aprender, recordar e integrarse con los sistemas de flujo de trabajo. La «división» no se trata de IQ modelo o capacidad de infraestructura sin procesar, sino de integrar el comportamiento adaptativo en la capa de aplicación y la orquestación de procesos.
Metodología
El informe se basa en un diseño de investigación de métodos múltiples realizado entre enero y junio de 2025. Los investigadores realizaron una revisión sistemática de más de 300 iniciativas de IA divulgadas públicamente, celebraron 52 entrevistas estructuradas con representantes de organizaciones entre industrias y reunieron 153 respuestas de encuestas de líderes senior en cuatro conferencias importantes. Los datos y las cotizaciones específicos de la empresa se anonimizaron para cumplir con las políticas de divulgación.
El informe está disponible en el repositorio de Nandapapers GitHub aquí.
Sobre el autor
David Ramel es editor y escritor en Converge 360.
