Saltar al contenido principal

R-TENSIONS — Contradicciones y tensiones en el corpus (findings adversariales · neutral)

NotebookLM 238984eb, query ADVERSARIAL (qué DISCREPA, no qué consensúa). Un research McKinsey debe mostrar dónde la evidencia choca, no solo el consenso. Neutral, SIN Momentum. (Nota: NotebookLM arrastró en su conclusión el "00 Context Brief" contaminado con HII/Momentum — eliminado aquí per firewall R00.)

1. Augmentación vs sustitución (el desacuerdo de fondo)

  • Optimista (augmentación / "centauros"): uso real 57% augmentación vs 43% automatización (Anthropic Economic Index, 2025); productividad +20-80% en cuello blanco (Mollick, Co-Intelligence 2024; estudios Wharton citados en Khan 2024). Tesis: la IA es fuerza complementaria que eleva la demanda de tareas no automatizables.
  • Pesimista (sustitución / "so-so automation"): −16% empleo relativo en jóvenes 22-25 en roles expuestos (Stanford Canaries, 2025); Acemoglu & Johnson (Power and Progress, 2023) denuncian la "automatización mediocre" — tecnología que desplaza trabajadores sin subir la productividad total (vigilancia, recorte de costes); la participación del trabajo en manufactura cayó del 65% (mediados 80s) al 46% (finales 2010s).
  • Síntesis neutral: la "augmentación" que reportan las empresas (Anthropic, autodeclarada) podría ser una fase de transición hacia sustitución que ya detectan los datos administrativos (Stanford). No es resoluble con el corpus actual — es la tensión central a vigilar.

2. Choque de cifras de exposición laboral (mismo fenómeno, números opuestos)

  • Frey & Osborne (2013): 47% de empleos US en alto riesgo — enfoque por ocupación.
  • OECD (2016): solo 9% — enfoque por tarea (el humano retiene las tareas no rutinarias dentro del rol).
  • PwC (2017): 38% para inicios 2030 — task-based con algoritmo distinto.
  • Lección de procedencia: la divergencia 9%↔47% es METODOLÓGICA (ocupación vs tarea), no empírica. Citar una sola sin la otra es engañoso. (Fuente: Aoun, Robot-Proof, recopila el debate.)

3. Capacidad potencial vs ejecución real (METR vs GAIA/WebArena)

  • METR (2025/26): horizonte de competencia ×2 cada 131 días (TH1.1, post-2023) — capacidad potencial en entornos de software controlados.
  • GAIA/WebArena: agentes 14-15% éxito vs humanos 78-92% — ejecución real en entornos web caóticos.
  • No se contradicen, miden cosas distintas: trayectoria rápida (METR) + brecha de fiabilidad enorme hoy (GAIA). El error es leer METR como si midiera despliegue real.

4. Refutaciones directas entre fuentes

  • Yin et al. (NBER w35110, 2026) REFUTA los índices de exposición (Eloundou, etc.): divergencia ×3,6 según qué LLM puntúa, acuerdo 57%; "la regla está hecha de la cosa que mide" → los resultados son frágiles. Debilita gran parte de la literatura de exposición.
  • Susskind (World Without Work) REFUTA la hipótesis ALM/Polanyi (Autor-Levy-Murnane): la "revolución pragmática" — los modelos capturan conocimiento tácito por inducción de patrones — vuelve irrelevante la frontera rutinario/no-rutinario que protegía los empleos cognitivos.
  • Acemoglu & Johnson REFUTAN el "tren de la productividad": la automatización sube la productividad MEDIA pero no la MARGINAL del trabajador (puede reducirla); rompe el vínculo histórico crecimiento→prosperidad compartida.
  • Hattie (2023) debilita los "estilos de aprendizaje" (visual/auditivo): el moderador robusto es la complejidad cognitiva + feedback + claridad de intenciones, no el estilo. (Relevante: descarta una vía pedagógica popular pero sin evidencia.)

Eslabón

Material para R24 (implicaciones con incertidumbre honesta) y R27 (red-team). La tesis del research debe SOSTENERSE sobre estas tensiones, no ignorarlas: declarar explícitamente que (a) augmentación-vs-sustitución es indecidible hoy, (b) las cifras de exposición son metodológicamente frágiles, (c) capacidad≠ejecución. Esto es lo que distingue un research McKinsey de un pitch.