R-TENSIONS — Contradicciones y tensiones en el corpus (findings adversariales · neutral)

NotebookLM 238984eb, query ADVERSARIAL (qué DISCREPA, no qué consensúa). Un research McKinsey debe mostrar dónde la evidencia choca, no solo el consenso. Neutral, SIN Momentum. (Nota: NotebookLM arrastró en su conclusión el "00 Context Brief" contaminado con HII/Momentum — eliminado aquí per firewall R00.)

1. Augmentación vs sustitución (el desacuerdo de fondo)

Optimista (augmentación / "centauros"): uso real 57% augmentación vs 43% automatización (Anthropic Economic Index, 2025); productividad +20-80% en cuello blanco (Mollick, Co-Intelligence 2024; estudios Wharton citados en Khan 2024). Tesis: la IA es fuerza complementaria que eleva la demanda de tareas no automatizables.
Pesimista (sustitución / "so-so automation"): −16% empleo relativo en jóvenes 22-25 en roles expuestos (Stanford Canaries, 2025); Acemoglu & Johnson (Power and Progress, 2023) denuncian la "automatización mediocre" — tecnología que desplaza trabajadores sin subir la productividad total (vigilancia, recorte de costes); la participación del trabajo en manufactura cayó del 65% (mediados 80s) al 46% (finales 2010s).
Síntesis neutral: la "augmentación" que reportan las empresas (Anthropic, autodeclarada) podría ser una fase de transición hacia sustitución que ya detectan los datos administrativos (Stanford). No es resoluble con el corpus actual — es la tensión central a vigilar.

2. Choque de cifras de exposición laboral (mismo fenómeno, números opuestos)

Frey & Osborne (2013): 47% de empleos US en alto riesgo — enfoque por ocupación.
OECD (2016): solo 9% — enfoque por tarea (el humano retiene las tareas no rutinarias dentro del rol).
PwC (2017): 38% para inicios 2030 — task-based con algoritmo distinto.
Lección de procedencia: la divergencia 9%↔47% es METODOLÓGICA (ocupación vs tarea), no empírica. Citar una sola sin la otra es engañoso. (Fuente: Aoun, Robot-Proof, recopila el debate.)

3. Capacidad potencial vs ejecución real (METR vs GAIA/WebArena)

METR (2025/26): horizonte de competencia ×2 cada 131 días (TH1.1, post-2023) — capacidad potencial en entornos de software controlados.
GAIA/WebArena: agentes 14-15% éxito vs humanos 78-92% — ejecución real en entornos web caóticos.
No se contradicen, miden cosas distintas: trayectoria rápida (METR) + brecha de fiabilidad enorme hoy (GAIA). El error es leer METR como si midiera despliegue real.

4. Refutaciones directas entre fuentes

Yin et al. (NBER w35110, 2026) REFUTA los índices de exposición (Eloundou, etc.): divergencia ×3,6 según qué LLM puntúa, acuerdo 57%; "la regla está hecha de la cosa que mide" → los resultados son frágiles. Debilita gran parte de la literatura de exposición.
Susskind (World Without Work) REFUTA la hipótesis ALM/Polanyi (Autor-Levy-Murnane): la "revolución pragmática" — los modelos capturan conocimiento tácito por inducción de patrones — vuelve irrelevante la frontera rutinario/no-rutinario que protegía los empleos cognitivos.
Acemoglu & Johnson REFUTAN el "tren de la productividad": la automatización sube la productividad MEDIA pero no la MARGINAL del trabajador (puede reducirla); rompe el vínculo histórico crecimiento→prosperidad compartida.
Hattie (2023) debilita los "estilos de aprendizaje" (visual/auditivo): el moderador robusto es la complejidad cognitiva + feedback + claridad de intenciones, no el estilo. (Relevante: descarta una vía pedagógica popular pero sin evidencia.)

Eslabón

Material para R24 (implicaciones con incertidumbre honesta) y R27 (red-team). La tesis del research debe SOSTENERSE sobre estas tensiones, no ignorarlas: declarar explícitamente que (a) augmentación-vs-sustitución es indecidible hoy, (b) las cifras de exposición son metodológicamente frágiles, (c) capacidad≠ejecución. Esto es lo que distingue un research McKinsey de un pitch.

1. Augmentación vs sustitución (el desacuerdo de fondo)​

2. Choque de cifras de exposición laboral (mismo fenómeno, números opuestos)​

3. Capacidad potencial vs ejecución real (METR vs GAIA/WebArena)​

4. Refutaciones directas entre fuentes​

Eslabón​

1. Augmentación vs sustitución (el desacuerdo de fondo)

2. Choque de cifras de exposición laboral (mismo fenómeno, números opuestos)

3. Capacidad potencial vs ejecución real (METR vs GAIA/WebArena)

4. Refutaciones directas entre fuentes

Eslabón