Saltar al contenido principal

R25 — Síntesis ejecutiva del RESEARCH PURO (neutral · SIN Momentum)

El "resultado del research" (entregable génesis #1) en su capa neutral. Describe el mundo; NO propone solución (eso es capa 2). Cada afirmación se apoya en los findings R10-R23 (grounded NotebookLM 75 fuentes, cifras con fuente+año). Confianza graduada: [ALTA]/[MEDIA]/[HIPÓTESIS]. Pendiente R27 (red-team) + R28 (lock).

Tesis del informe (una frase)

El mercado de educación online de adultos es grande pero estructuralmente roto en su promesa central —que aprender se traduzca en hacer—, y la IA, al volver casi gratis la producción de aprendizaje sin resolver su transferencia, desplaza el valor del contenido hacia la verificación, el juicio y el time-to-value. [ALTA]

Los 5 hallazgos que sostienen la tesis

  1. El contenido se commoditiza; el cuello de botella nunca fue el contenido. El mercado EdTech es grande (HolonIQ proyectó $404B/2025 a 16,3% CAGR — proyección 2020 pre-pandemia, no dato observado) pero su promesa falla: completion de MOOCs en dígitos simples, ~30% de la formación se aplica, ROI inarticulable, credenciales infladas (R10, R14, R16). El problema es transferencia y entorno, no falta de material. [ALTA en el diagnóstico estructural · la cifra de tamaño es PROYECCIÓN]
  2. La IA abarata radicalmente lo que más funciona pedagógicamente, pero no su talón de Aquiles. Tutoría 1-a-1 (2σ, Bloom 1984), práctica deliberada con feedback, aprendizaje situado eran inviables a escala; la IA los abarata (lección en segundos; grading automatizado ICC 0,94-0,97, Yavuz 2025; tutor 24/7) (R13, R14). Pero la transferencia falla por entorno (apoyo del manager, oportunidad de aplicar, feedback en el flujo) que la IA no resuelve sola (R14, R15). [ALTA]
  3. La autonomía agéntica fiable sigue baja, pero mejora rápido. GAIA 15% vs 92% humano; τ-bench <50%; memoria agéntica 12% (BFCL) — y a la vez horizonte METR ×2 cada ~4,3 meses post-2023 (R13). La ventana de "copiloto, no piloto" es real hoy y estrecha. [ALTA en estado · MEDIA en velocidad futura]
  4. El golpe laboral temprano es la puerta de entrada, no el paro. −16% empleo en jóvenes 22-25 expuestos (Stanford), −14% hiring (Anthropic), pero sin subida del paro agregado de expuestos (R18). El relato dominante ("la IA destruye empleos") mira la variable equivocada. [ALTA · dato observado]
  5. El dinero y la demanda convergen en lo mismo: outcomes, no contenido. Enterprise compra retención/ROI ("make/save money or mitigate risk"); B2C compra empleabilidad/ejecución (solo 16% confía en el título); el capital prefiere outcome-based + workflow-embedded; los modelos viran de time-billing a value/outcome (R10, R15-R17). [ALTA]

Implicaciones neutrales (sin solución concreta)

  • [ALTA] El valor migra de "entregar contenido/saber" a "garantizar hacer verificable" (verificación, juicio, transferencia). Responde RQ-22.
  • [ALTA · dato observado] El primer mercado de formación afectado por la IA no es el del desempleado, sino el del junior que no entra (−16% empleo y −14% hiring en 22-25 expuestos; el paro agregado de expuestos NO sube — de hecho el de los manuales sube más: manuales +0,94 pp vs expuestos +0,30 pp, 2022-2025).
  • [HIPÓTESIS] Corolario no cuantificado: si se erosiona la entrada junior, se erosiona el aprendizaje-en-el-puesto que forma séniores → posible demanda de formación que lo sustituya. (Es inferencia, no dato — ver R20.)
  • [MEDIA] Espacio para credenciales basadas en evidencia de ejecución (proof-of-work) frente al título-filtro inflado, ahora que la IA puede "dar fe" del proceso.
  • [MEDIA] La formación integrada en el flujo de trabajo (workflow-embedded) gana frente al curso aislado — ya es señal de mercado (capital 2026), no profecía.
  • [HIPÓTESIS] Rotura estructural de la escalera junior→sénior: si la IA absorbe las tareas de aprendiz, ¿cómo se forma el sénior? White space no cuantificado en el corpus.

White spaces neutrales (oportunidades del MUNDO, no propuestas)

  1. Medir impacto/transferencia con datos de ejecución reales (las métricas de exposición LLM son frágiles, ×3,6 divergencia — NBER).
  2. Cerrar la brecha de transferencia vía entorno (apoyo, oportunidad, feedback en el flujo), no más contenido.
  3. Acreditación creíble basada en ejecución verificable.
  4. Onboarding/formación que reemplace el aprendizaje-en-el-puesto erosionado para noveles.
  5. Habilidades psicomotoras/físicas: brecha de evidencia → posible foso para lo no digitalizable.

Escenarios 2027-2030 (resumen · detalle en R19-R23)

Eje capacidad agéntica × eje adopción institucional. Apuesta de mayor probabilidad: B "Augmentación estable" (capacidad sube, compliance/confianza frenan delegación total → domina el 57/43 augmentación; la formación valiosa enseña a operar/verificar IA). Alternativas: A "Compresión", C "Meseta de fiabilidad", D "Disrupción de credenciales". Cada uno con early indicators medibles.

Nota de procedencia y sesgo de fuente (R27 red-team)

  • Sesgo geográfico US (gap relevante para capa 2): casi toda la evidencia laboral y de credenciales es US-céntrica (Stanford, Anthropic, EIG, "16% de estadounidenses"). Para un actor EU/España, la demanda B2C y el marco regulatorio EU están infra-cubiertos. Triangular antes de extrapolar a Europa.
  • Fuentes mono-autor a triangular: varios claims de credenciales/profesiones/completion se apoyan en Susskind (fuente secundaria que cita encuestas primarias); la jerarquía pedagógica se apoya en Hattie (promediado de ES cuestionado); el dimensionamiento y señales de mercado en HolonIQ (vendor, no peer-reviewed). Confianzas ya degradadas en los findings; triangular con fuentes primarias antes de usarlos como pilar en capa 2.
  • Asimetría B2B/B2C: R15 (enterprise) está mejor soportado con cifras que R16 (B2C, apoyado sobre todo en Susskind).

Gaps cerrados / residuales

  • R11/R12 demanda+oferta por categorías: ✅ cerrado tras R27 — ver findings/R11-R12-demand-supply.md (9 categorías de oferta con límite estructural + 4 JTBD).
  • Residual: el landscape no nombra players individuales (por diseño, R00 prohíbe marcas favoritas); la capa 2 puede mapear competidores concretos si lo necesita.

Preguntas abiertas (más research)

  • ¿Cifras netas de creación vs destrucción de empleo (el corpus no las da)?
  • ¿Rentabilidad comparada outcome-based vs suscripción (no hay dato 2026)?
  • ¿Evidencia directa de andragogía (Knowles) — gap de extractos en el corpus?
  • ¿Datos de mercado adulto B2C en EU/España (corpus US-céntrico)?

Profundización adversarial (interrogación deep del corpus — ver findings R-tensions, R22-deep, R23-deep)

  • Tensiones que el research DEBE declarar (no ocultar): augmentación-vs-sustitución es indecidible hoy (Anthropic 57/43 autodeclarado vs Stanford −16% administrativo); las cifras de exposición son metodológicamente frágiles (Frey 47% por-ocupación vs OECD 9% por-tarea; NBER ×3,6 entre modelos); capacidad ≠ ejecución (METR potencial vs GAIA/WebArena 14-15% real).
  • Señales no-obvias de mayor valor: el "experto dormido" (mejor IA → peor juicio humano, Dell'Acqua); la IA como "gran ecualizador" (brecha BCG 22%→4%, mayor boost al menos cualificado — contradice el skill-biased technical change); el valor humano migra al intervalo de re-ejecución/reparación (half-life del agente, Ord); "shadow learning" (el aprendizaje IA-nativo puede ser informal, off-L&D) [HIPÓTESIS].
  • Escenarios 27-30, eje real: capacidad exponencial (METR 130,8d) vs techo de fiabilidad (UpBench pmax≈0,57); early indicators medibles ya (gap exposición observada-vs-teórica, rescue-rate HITL 18-23%, tráfico API-sobre-chat); driver institucional decisivo (EU AI Act = alto riesgo en educación/RRHH; sindicatos Alemania-vs-EE.UU.; lag de acreditación).

Frontera (recordatorio R00)

Nada aquí nombra una solución. La capa 2 (paper de visión Momentum) decidirá qué hipótesis construir sobre estos findings, vía la tabla finding → evidencia → implicación neutral → hipótesis → confianza. Este informe debe quedar locked (R28) antes de abrir la capa 2.