Saltar al contenido principal

R23 — Escenarios 2027-2030: drivers, early indicators, regulación (deep · neutral)

NotebookLM 238984eb, query de escenarios. Profundiza el R23 inicial con drivers cuantificados + indicadores tempranos medibles + rol institucional. [MEDIDO]/[ILUSTRATIVO]/[INFERENCIA].

Drivers de divergencia (qué mueve el mundo a cada escenario)

A · "Compresión rápida" (la autonomía supera las restricciones)

  • METR — aceleración del horizonte [MEDIDO]: doubling-time del 50%-task-horizon = 130,8 días post-2023 (TH1.1) vs 195,8 d histórico. [ILUSTRATIVO] de mantenerse → en ~5 años IA automatiza tareas de software de un mes de experto.
  • GDPval — cierre de la brecha de calidad [MEDIDO]: rendimiento en tareas económicamente valiosas mejora lineal; los mejores modelos ya se aproximan a expertos de 14 años de experiencia.
  • Auto-mejora / ACI [ILUSTRATIVO]: agentes que conducen sus propios ciclos de I+D (Suleyman, Coming Wave; "gorilla problem" de Russell) → hiper-evolución fuera del control humano.

B · "Meseta de fiabilidad" (la autonomía choca con un techo)

  • Techo operativo pmax [MEDIDO]: UpBench fija pmax ≈ 0,57 — no por el modelo sino por restricciones de entorno (acceso a herramientas, presupuesto, rate-limits, políticas de seguridad, APIs). Si no escala, la IA queda en tareas atómicas. [El propio paper marca el fit como extrapolación de alta varianza.]
  • Decaimiento exponencial (half-life) [ILUSTRATIVO]: tasa de fallo constante por minuto-humano → la probabilidad de éxito cae exponencialmente con la duración de la tarea (Toby Ord).
  • Baja fiabilidad en entornos reales [MEDIDO]: GAIA 15%, OSWorld 12,24%, WebArena 14,41% vs humanos 72-92% → la IA aún falla en ~85% de tareas reales donde el humano acierta.

Indicadores tempranos (early warning, medibles YA)

  1. Gap exposición observada vs teórica [MEDIDO]: si la observed exposure (uso real profesional) empieza a cubrir rápido la β teórica de Eloundou → compresión rápida (Anthropic, Labor market impacts).
  2. Rescue rate HITL [MEDIDO]: hoy 18-23% de tareas fallidas se "rescatan" con una iteración de feedback humano (UpBench); si sube → agentes más entrenables en tiempo real (fusión ejecución-aprendizaje).
  3. Tráfico API sobre chat [MEDIDO]: el uso vía API ejecuta tareas más complejas/rápidas que el chat (Anthropic Economic Index); un desplazamiento masivo de volumen a API señala el paso de "asistente" a "fuerza laboral agéntica".

Rol de la regulación / instituciones (freno o dirección)

  • EU AI Act: clasifica IA en educación y gestión de fuerza laboral como ALTO RIESGO → exige transparencia, control humano, documentación (Suleyman; McKinsey). [INFERENCIA] frena agentes 100% autónomos en Europa, favorece modelos de alta intensidad de input humano.
  • Accountability / barreras culturales [MEDIDO-cualitativo]: instituciones financieras/legales se resisten a delegar decisiones críticas (hipotecas, juicios) aunque la IA sea capaz — exigen responsabilidad humana (ILO WP140).
  • Poder de negociación / reparto de rentas (Acemoglu & Johnson): el impacto salarial depende del poder de los trabajadores. Mercados con sindicatos fuertes (Alemania) → IA complementaria/upskilling; mercados desregulados (EE.UU.) → "automatización mediocre" (sustitución sin ganancia de productividad). → el escenario es geográfico/institucional, no solo técnico.
  • Lag de acreditación [MEDIDO-cualitativo]: la regulación de acreditación es lenta → desfase entre skills que demanda el mercado (IA-nativa) y las que certifican las instituciones (Mitchell; authentic-assessment lit).
  • "Right to explanation" (GDPR 2018): exige "información significativa sobre la lógica" en decisiones automatizadas → tensión con métodos deep-learning opacos (Mitchell).

Síntesis (el eje real de 2027-2030)

La batalla no es humanos vs máquinas, sino progreso exponencial de la capacidad potencial (METR) vs techo de cristal de la fiabilidad operativa (pmax) — arbitrado por integración en flujos securizados y por si las instituciones redirigen hacia la "utilidad de la máquina" (complementar al trabajador, Acemoglu) en vez de la "inteligencia de la máquina" (imitar/sustituir). El driver institucional (EU AI Act, sindicatos, acreditación) puede ser tan decisivo como el técnico.