R-TENSIONS — Contradicciones y tensiones en el corpus (findings adversariales · neutral)
NotebookLM
238984eb, query ADVERSARIAL (qué DISCREPA, no qué consensúa). Un research McKinsey debe mostrar dónde la evidencia choca, no solo el consenso. Neutral, SIN Momentum. (Nota: NotebookLM arrastró en su conclusión el "00 Context Brief" contaminado con HII/Momentum — eliminado aquí per firewall R00.)
1. Augmentación vs sustitución (el desacuerdo de fondo)
- Optimista (augmentación / "centauros"): uso real 57% augmentación vs 43% automatización (Anthropic Economic Index, 2025); productividad +20-80% en cuello blanco (Mollick, Co-Intelligence 2024; estudios Wharton citados en Khan 2024). Tesis: la IA es fuerza complementaria que eleva la demanda de tareas no automatizables.
- Pesimista (sustitución / "so-so automation"): −16% empleo relativo en jóvenes 22-25 en roles expuestos (Stanford Canaries, 2025); Acemoglu & Johnson (Power and Progress, 2023) denuncian la "automatización mediocre" — tecnología que desplaza trabajadores sin subir la productividad total (vigilancia, recorte de costes); la participación del trabajo en manufactura cayó del 65% (mediados 80s) al 46% (finales 2010s).
- Síntesis neutral: la "augmentación" que reportan las empresas (Anthropic, autodeclarada) podría ser una fase de transición hacia sustitución que ya detectan los datos administrativos (Stanford). No es resoluble con el corpus actual — es la tensión central a vigilar.
2. Choque de cifras de exposición laboral (mismo fenómeno, números opuestos)
- Frey & Osborne (2013): 47% de empleos US en alto riesgo — enfoque por ocupación.
- OECD (2016): solo 9% — enfoque por tarea (el humano retiene las tareas no rutinarias dentro del rol).
- PwC (2017): 38% para inicios 2030 — task-based con algoritmo distinto.
- Lección de procedencia: la divergencia 9%↔47% es METODOLÓGICA (ocupación vs tarea), no empírica. Citar una sola sin la otra es engañoso. (Fuente: Aoun, Robot-Proof, recopila el debate.)
3. Capacidad potencial vs ejecución real (METR vs GAIA/WebArena)
- METR (2025/26): horizonte de competencia ×2 cada 131 días (TH1.1, post-2023) — capacidad potencial en entornos de software controlados.
- GAIA/WebArena: agentes 14-15% éxito vs humanos 78-92% — ejecución real en entornos web caóticos.
- No se contradicen, miden cosas distintas: trayectoria rápida (METR) + brecha de fiabilidad enorme hoy (GAIA). El error es leer METR como si midiera despliegue real.
4. Refutaciones directas entre fuentes
- Yin et al. (NBER w35110, 2026) REFUTA los índices de exposición (Eloundou, etc.): divergencia ×3,6 según qué LLM puntúa, acuerdo 57%; "la regla está hecha de la cosa que mide" → los resultados son frágiles. Debilita gran parte de la literatura de exposición.
- Susskind (World Without Work) REFUTA la hipótesis ALM/Polanyi (Autor-Levy-Murnane): la "revolución pragmática" — los modelos capturan conocimiento tácito por inducción de patrones — vuelve irrelevante la frontera rutinario/no-rutinario que protegía los empleos cognitivos.
- Acemoglu & Johnson REFUTAN el "tren de la productividad": la automatización sube la productividad MEDIA pero no la MARGINAL del trabajador (puede reducirla); rompe el vínculo histórico crecimiento→prosperidad compartida.
- Hattie (2023) debilita los "estilos de aprendizaje" (visual/auditivo): el moderador robusto es la complejidad cognitiva + feedback + claridad de intenciones, no el estilo. (Relevante: descarta una vía pedagógica popular pero sin evidencia.)
Eslabón
Material para R24 (implicaciones con incertidumbre honesta) y R27 (red-team). La tesis del research debe SOSTENERSE sobre estas tensiones, no ignorarlas: declarar explícitamente que (a) augmentación-vs-sustitución es indecidible hoy, (b) las cifras de exposición son metodológicamente frágiles, (c) capacidad≠ejecución. Esto es lo que distingue un research McKinsey de un pitch.