Research Protocol v2 — RESEARCH PURO (capa neutral, SIN Momentum)

Canónico. Supersede research/research-plan.md (v1, contaminado con Momentum — 99 menciones medidas 2026-06-18). Origen: orquestación ChatGPT (conv 6a32cf87, modo n8n exigente) + post-mortem CEO + ground-truth de esta sesión. Regla nuclear: este documento y todo lo que cuelga de research/pure/ describe el MUNDO (mercado, tendencias, IA, aprendizaje adulto). NO vende ni diseña una solución. Momentum NO aparece. Momentum vive en la capa 2 (paper de visión), que consume este research ya locked.

Causa raíz de los 3 fallos (diagnóstico, no síntoma)

Research contaminado = no había firewall semántica entre dos trabajos distintos (investigación neutral de mercado vs narrativa de producto). Se mezclaron evidencia, interpretación y posicionamiento → el research dejó de ser creíble como informe externo.
Journal pobre = se trató como entregable final, no como log operativo obligatorio por nodo. El rationale no capturado en el momento de decidir se reconstruye superficial.
Corpus insuficiente / NotebookLM dudoso = faltó capa de corpus operations (criterios por tipo de fuente, status documental, trazabilidad, prueba de consulta). 25 fuentes = muestra, no corpus estratégico. "Subido a NotebookLM" no es verificable sin manifest + conteo + sanity prompts con citas.

Causa sistémica común: se trabajó como producción de contenido, no como pipeline de investigación auditable.

Secuencia macro (INVIOLABLE)

RESEARCH PURO (locked) → Paper de visión Momentum → Marketing / Landing / Repo. El mandato original mezcló 4 trabajos (research neutral · corpus ops · journal/sistema de pensamiento · visión/marca/producto) y la 1ª pasada los ejecutó como uno solo. Aquí se separan.

Grafo de nodos (R00–R28)

Regla base de gate: un nodo sin criterio de verificación queda rechazado por defecto.

id	objetivo	output	dependencias
R00_SCOPE_FIREWALL	Frontera del research neutral + lenguaje prohibido	scope memo (ver `R00-scope-firewall.md`)	—
R01_RESEARCH_PROTOCOL	Método, taxonomía de fuentes, pesos de evidencia, plantilla de evaluación	este documento	R00
R02_QUESTION_TREE	Mandato → research questions neutrales MECE	árbol de preguntas (§RQ)	R01
R03_SOURCE_DISCOVERY	Universo inicial de fuentes 2024-2026	longlist 100-150	R02
R04_BOOK_CORPUS	Subcorpus de libros/monografías (corregir gap)	libros con status legal/disponibilidad/prioridad	R03
R05_SOURCE_SCREENING	Filtrar por calidad/relevancia/no-redundancia	shortlist 50-70	R03,R04
R06_BIBLIOGRAPHY_SHEET	Sheet maestro bibliografía + estado documental	Sheet (schema en `bibliography-schema.md`)	R05
R07_DOCUMENT_ACQUISITION	Obtener legalmente el máximo de documentos	carpeta corpus + status	R06
R08_NOTEBOOKLM_LOAD	Cargar/particionar corpus en NotebookLM	notebook(s) + manifest + prueba de conteo	R07
R09_NOTEBOOKLM_VALIDATION	Verificar recuperación desde fuentes cargadas	sanity checks con citas + gaps	R08
R10_MARKET_MAP	Mapa de mercado educación online adulta B2B+B2C	taxonomía segmentos/compradores/formatos/modelos	R05-R09
R11_DEMAND_JTBD	Demanda: jobs-to-be-done adultos/empresas/L&D	mapa necesidades/fricciones/WTP	R10
R12_SUPPLY_COMPETITION	Oferta: EdTech/L&D/bootcamps/universidades/plataformas IA	landscape por categorías (no marcas favoritas)	R10
R13_AI_AGENT_FRONTIER	Qué permiten IA/agentes en educación/trabajo adulto	matriz capacidad→caso→evidencia→límite	R09
R14_LEARNING_SCIENCE	Ciencia del aprendizaje adulto	principios validados (retención, transferencia, práctica deliberada)	R09
R15_ENTERPRISE_ADOPTION	Adopción enterprise: procurement/compliance/ROI/governance	barreras + aceleradores B2B	R10,R13
R16_B2C_ADOPTION	Adopción individual: motivación/abandono/credenciales/pricing	barreras + aceleradores B2C	R10,R14
R17_BUSINESS_MODELS	Modelos de negocio y unit economics	patrones de monetización comparados	R12,R15,R16
R18_LABOUR_MARKET_IMPACT	Impacto IA en tareas/skills/roles/empleabilidad	mapa tareas afectadas / reskilling / nuevos roles	R13
R19_SECOND_DERIVATIVE	2ª derivada: capacidades IA → rediseño de tareas/workflows	tesis de 2º orden	R13,R18
R20_THIRD_DERIVATIVE	3ª derivada: workflows → puestos/roles/estructura org	tesis de 3er orden	R19
R21_FOURTH_DERIVATIVE	4ª derivada: roles → mercado educativo/credenciales/regulación	tesis de 4º orden	R20
R22_WEAK_SIGNALS	Serendipia: señales no aparentes, patrones adyacentes	señales débiles priorizadas + cómo se verificarían	R10-R21
R23_SCENARIOS_2027_2030	Escenarios IA 2027/28/29/30	3-4 escenarios con drivers/triggers/early indicators	R19-R22
R24_STRATEGIC_IMPLICATIONS_NEUTRAL	Implicaciones sin solución concreta	oportunidades/riesgos/white spaces (confianza graduada)	R10-R23
R25_RESEARCH_REPORT	Informe final de research puro	informe consulting (exec summary, findings, evidence, escenarios, appendices)	R24
R26_JOURNAL_BOOK	Todo el proceso como libro/journal	HTML book journal (decisiones, rationale, cambios de opinión, rejected paths)	todos
R27_RED_TEAM_QA	Auditar contaminación/fuentes/razonamiento/claims	QA report aprobado/rechazado por nodo	R25,R26,R06
R28_FINAL_RESEARCH_LOCK	Congelar research puro	versión locked + changelog + bibliografía final	R27

Research questions neutrales (R02) — sin Momentum

¿Cómo evoluciona el mercado global de educación online de adultos entre B2C, B2B y formación corporativa?
¿Qué problemas estructurales siguen sin resolverse (abandono, transferencia al trabajo, motivación, personalización, acreditación, ROI, confianza)?
¿Qué segmentos de adultos aprenden online y con qué jobs-to-be-done (promoción, cambio de carrera, productividad, emprendimiento, compliance, up/reskilling)?
¿Cómo compran las empresas formación 2024-2026 (quién decide, quién paga, qué métricas exige, qué objeciones bloquean)?
¿Cómo compran los individuos (qué pagan, qué abandonan, qué perciben como valor, qué formatos retienen mejor)?
¿Qué impacto real tienen IA generativa y agentes en creación, personalización, evaluación y entrega educativa?
¿Dónde la IA mejora el aprendizaje y dónde solo abarata la producción de contenido sin mejorar resultados?
¿Qué evidencia existe sobre aprendizaje adulto, práctica deliberada, feedback, transferencia al puesto, aprendizaje situado?
¿Qué modelos de aprendizaje son más robustos para adultos (cohorte, self-paced, tutoría, simulación, proyectos, comunidades, workplace, blended)?
¿Cómo cambia la formación corporativa cuando el output esperado no es "saber" sino "hacer algo útil en el trabajo"?
¿Qué nuevas formas de evaluación, credencialización y proof-of-work emergen cuando la IA puede producir parte del output?
¿Qué tareas cognitivas están siendo aumentadas o automatizadas por IA y qué implica para la formación adulta?
¿Qué puestos se exponen a sustitución parcial y cuáles se transforman por augmentación?
¿Qué nuevos roles humanos aparecen alrededor de la IA (supervisión, validación, diseño de workflows, gestión de agentes, contexto, gobernanza)?
¿Qué capacidades humanas se vuelven más escasas (juicio, framing, criterio, transferencia, ética, comunicación, gestión de ambigüedad)?
¿Qué barreras frenan la adopción enterprise (privacidad, compliance, procurement, integración, calidad, seguridad, governance)?
¿Qué barreras frenan la adopción B2C (saturación de cursos, baja confianza, bajo completion, dificultad de monetizar skills, credenciales débiles)?
¿Qué modelos de negocio emergen (suscripción, seats enterprise, outcomes-based, AI tutor, marketplace de expertos, credenciales, agents-as-coaches)?
¿Qué señales débiles sugieren cambios no obvios en EdTech, HRTech, productividad, empleo y certificación?
¿Qué escenarios plausibles existen para 2027-2030 según velocidad de IA, regulación, adopción empresarial y transformación laboral?
¿Qué white spaces aparecen si se separa contenido, tutoría, práctica, evaluación, credencialización y ejecución laboral?
¿Qué tendría que ser verdad para que la educación online adulta deje de vender contenido y empiece a vender reducción de time-to-value?

Gates de calidad + evidencia por nodo

Ver tablas D (gates aprobado/rechazado) y E (evidencia mínima) en el audit: .governance/dev/chatgpt-bridge-audit/2026-06-18__conv1-research-orchestration.md. Resumen de los más críticos:

R06: columnas id, title, author, year, type, source_url, publisher, doi_isbn, topic_cluster, relevance_score, credibility_score, recency, access_status, obtained_status, notebooklm_status, notes, claims_supported.
R09: 8-12 prompts de sanity check con respuestas citadas + tabla de fuentes que NotebookLM no usa o cita mal.
R19-R21: cada derivada en tabla (tendencia base → consecuencia → evidencia → incertidumbre).
R23: escenarios con 2 ejes, drivers, triggers, probabilidades cualitativas, early indicators, riesgos.
R25: cada claim crítico con 2+ fuentes o marcado [HIPÓTESIS]. (Guard de procedencia numérica de FUNDAMENTALS.)
R27: red-team checklist (contaminación, fuentes antiguas, sesgo vendor, claims sin evidencia, ausencia de libros, NotebookLM no verificado).

Ground-truth de esta sesión (2026-06-18) — estado real medido

NotebookLM (id 238984eb): 75 fuentes cargadas y verificadas (notebook_get). Corpus neutral y reciente: libros 2005-2024, informes mercado (WEF Future of Jobs 2025, McKinsey, Deloitte, LinkedIn Learning, EdTech market sizing), papers labor-IA (Anthropic Economic Index, Stanford Canaries, NBER, METR Time Horizon, GDPval, ILO WP140), benchmarks agénticos (SWE-bench, GAIA, τ-bench, OSWorld, WebArena). → La duda del CEO sobre NotebookLM es en gran parte infundada en cuanto a carga; lo que faltaba era el manifest + validación de recuperación (R08/R09). El límite "50 fuentes/notebook" que cita ChatGPT NO aplica aquí (75 cargadas OK → plan superior).
Corpus en disco: 25/50 libros. La meta "50 libros" es un objetivo de disco/repo, distinto de las 75 fuentes de NotebookLM. Descarga bloqueada por cuota hasta medianoche UTC.
Contaminación medida: 99 menciones "Momentum" en research/ (v1). research/pure/ arranca limpio.

Adaptaciones / decisiones abiertas

OD-007 (Anna's Archive / copyright): ChatGPT (conservador) recomienda NO depender de Anna's Archive para libros con copyright; usar metadata + acceso legal/open-access/compra/préstamo. El mandato CEO autorizó annas-archive y la skill lo enmarca como lectura personal de research. → Decisión de negocio/legal del CEO. Mientras tanto: el Sheet añade columnas doi_isbn + access_status (legal vs personal-reading) para que la procedencia sea auditable sea cual sea la decisión. Ver .governance/open-decisions.md.

Causa raíz de los 3 fallos (diagnóstico, no síntoma)​

Secuencia macro (INVIOLABLE)​

Grafo de nodos (R00–R28)​

Research questions neutrales (R02) — sin Momentum​

Gates de calidad + evidencia por nodo​

Ground-truth de esta sesión (2026-06-18) — estado real medido​

Adaptaciones / decisiones abiertas​