Research Protocol v2 — RESEARCH PURO (capa neutral, SIN Momentum)
Canónico. Supersede
research/research-plan.md(v1, contaminado con Momentum — 99 menciones medidas 2026-06-18). Origen: orquestación ChatGPT (conv 6a32cf87, modo n8n exigente) + post-mortem CEO + ground-truth de esta sesión. Regla nuclear: este documento y todo lo que cuelga deresearch/pure/describe el MUNDO (mercado, tendencias, IA, aprendizaje adulto). NO vende ni diseña una solución. Momentum NO aparece. Momentum vive en la capa 2 (paper de visión), que consume este research ya locked.
Causa raíz de los 3 fallos (diagnóstico, no síntoma)
- Research contaminado = no había firewall semántica entre dos trabajos distintos (investigación neutral de mercado vs narrativa de producto). Se mezclaron evidencia, interpretación y posicionamiento → el research dejó de ser creíble como informe externo.
- Journal pobre = se trató como entregable final, no como log operativo obligatorio por nodo. El rationale no capturado en el momento de decidir se reconstruye superficial.
- Corpus insuficiente / NotebookLM dudoso = faltó capa de corpus operations (criterios por tipo de fuente, status documental, trazabilidad, prueba de consulta). 25 fuentes = muestra, no corpus estratégico. "Subido a NotebookLM" no es verificable sin manifest + conteo + sanity prompts con citas.
- Causa sistémica común: se trabajó como producción de contenido, no como pipeline de investigación auditable.
Secuencia macro (INVIOLABLE)
RESEARCH PURO (locked) → Paper de visión Momentum → Marketing / Landing / Repo.
El mandato original mezcló 4 trabajos (research neutral · corpus ops · journal/sistema de pensamiento · visión/marca/producto) y la 1ª pasada los ejecutó como uno solo. Aquí se separan.
Grafo de nodos (R00–R28)
Regla base de gate: un nodo sin criterio de verificación queda rechazado por defecto.
| id | objetivo | output | dependencias |
|---|---|---|---|
| R00_SCOPE_FIREWALL | Frontera del research neutral + lenguaje prohibido | scope memo (ver R00-scope-firewall.md) | — |
| R01_RESEARCH_PROTOCOL | Método, taxonomía de fuentes, pesos de evidencia, plantilla de evaluación | este documento | R00 |
| R02_QUESTION_TREE | Mandato → research questions neutrales MECE | árbol de preguntas (§RQ) | R01 |
| R03_SOURCE_DISCOVERY | Universo inicial de fuentes 2024-2026 | longlist 100-150 | R02 |
| R04_BOOK_CORPUS | Subcorpus de libros/monografías (corregir gap) | libros con status legal/disponibilidad/prioridad | R03 |
| R05_SOURCE_SCREENING | Filtrar por calidad/relevancia/no-redundancia | shortlist 50-70 | R03,R04 |
| R06_BIBLIOGRAPHY_SHEET | Sheet maestro bibliografía + estado documental | Sheet (schema en bibliography-schema.md) | R05 |
| R07_DOCUMENT_ACQUISITION | Obtener legalmente el máximo de documentos | carpeta corpus + status | R06 |
| R08_NOTEBOOKLM_LOAD | Cargar/particionar corpus en NotebookLM | notebook(s) + manifest + prueba de conteo | R07 |
| R09_NOTEBOOKLM_VALIDATION | Verificar recuperación desde fuentes cargadas | sanity checks con citas + gaps | R08 |
| R10_MARKET_MAP | Mapa de mercado educación online adulta B2B+B2C | taxonomía segmentos/compradores/formatos/modelos | R05-R09 |
| R11_DEMAND_JTBD | Demanda: jobs-to-be-done adultos/empresas/L&D | mapa necesidades/fricciones/WTP | R10 |
| R12_SUPPLY_COMPETITION | Oferta: EdTech/L&D/bootcamps/universidades/plataformas IA | landscape por categorías (no marcas favoritas) | R10 |
| R13_AI_AGENT_FRONTIER | Qué permiten IA/agentes en educación/trabajo adulto | matriz capacidad→caso→evidencia→límite | R09 |
| R14_LEARNING_SCIENCE | Ciencia del aprendizaje adulto | principios validados (retención, transferencia, práctica deliberada) | R09 |
| R15_ENTERPRISE_ADOPTION | Adopción enterprise: procurement/compliance/ROI/governance | barreras + aceleradores B2B | R10,R13 |
| R16_B2C_ADOPTION | Adopción individual: motivación/abandono/credenciales/pricing | barreras + aceleradores B2C | R10,R14 |
| R17_BUSINESS_MODELS | Modelos de negocio y unit economics | patrones de monetización comparados | R12,R15,R16 |
| R18_LABOUR_MARKET_IMPACT | Impacto IA en tareas/skills/roles/empleabilidad | mapa tareas afectadas / reskilling / nuevos roles | R13 |
| R19_SECOND_DERIVATIVE | 2ª derivada: capacidades IA → rediseño de tareas/workflows | tesis de 2º orden | R13,R18 |
| R20_THIRD_DERIVATIVE | 3ª derivada: workflows → puestos/roles/estructura org | tesis de 3er orden | R19 |
| R21_FOURTH_DERIVATIVE | 4ª derivada: roles → mercado educativo/credenciales/regulación | tesis de 4º orden | R20 |
| R22_WEAK_SIGNALS | Serendipia: señales no aparentes, patrones adyacentes | señales débiles priorizadas + cómo se verificarían | R10-R21 |
| R23_SCENARIOS_2027_2030 | Escenarios IA 2027/28/29/30 | 3-4 escenarios con drivers/triggers/early indicators | R19-R22 |
| R24_STRATEGIC_IMPLICATIONS_NEUTRAL | Implicaciones sin solución concreta | oportunidades/riesgos/white spaces (confianza graduada) | R10-R23 |
| R25_RESEARCH_REPORT | Informe final de research puro | informe consulting (exec summary, findings, evidence, escenarios, appendices) | R24 |
| R26_JOURNAL_BOOK | Todo el proceso como libro/journal | HTML book journal (decisiones, rationale, cambios de opinión, rejected paths) | todos |
| R27_RED_TEAM_QA | Auditar contaminación/fuentes/razonamiento/claims | QA report aprobado/rechazado por nodo | R25,R26,R06 |
| R28_FINAL_RESEARCH_LOCK | Congelar research puro | versión locked + changelog + bibliografía final | R27 |
Research questions neutrales (R02) — sin Momentum
- ¿Cómo evoluciona el mercado global de educación online de adultos entre B2C, B2B y formación corporativa?
- ¿Qué problemas estructurales siguen sin resolverse (abandono, transferencia al trabajo, motivación, personalización, acreditación, ROI, confianza)?
- ¿Qué segmentos de adultos aprenden online y con qué jobs-to-be-done (promoción, cambio de carrera, productividad, emprendimiento, compliance, up/reskilling)?
- ¿Cómo compran las empresas formación 2024-2026 (quién decide, quién paga, qué métricas exige, qué objeciones bloquean)?
- ¿Cómo compran los individuos (qué pagan, qué abandonan, qué perciben como valor, qué formatos retienen mejor)?
- ¿Qué impacto real tienen IA generativa y agentes en creación, personalización, evaluación y entrega educativa?
- ¿Dónde la IA mejora el aprendizaje y dónde solo abarata la producción de contenido sin mejorar resultados?
- ¿Qué evidencia existe sobre aprendizaje adulto, práctica deliberada, feedback, transferencia al puesto, aprendizaje situado?
- ¿Qué modelos de aprendizaje son más robustos para adultos (cohorte, self-paced, tutoría, simulación, proyectos, comunidades, workplace, blended)?
- ¿Cómo cambia la formación corporativa cuando el output esperado no es "saber" sino "hacer algo útil en el trabajo"?
- ¿Qué nuevas formas de evaluación, credencialización y proof-of-work emergen cuando la IA puede producir parte del output?
- ¿Qué tareas cognitivas están siendo aumentadas o automatizadas por IA y qué implica para la formación adulta?
- ¿Qué puestos se exponen a sustitución parcial y cuáles se transforman por augmentación?
- ¿Qué nuevos roles humanos aparecen alrededor de la IA (supervisión, validación, diseño de workflows, gestión de agentes, contexto, gobernanza)?
- ¿Qué capacidades humanas se vuelven más escasas (juicio, framing, criterio, transferencia, ética, comunicación, gestión de ambigüedad)?
- ¿Qué barreras frenan la adopción enterprise (privacidad, compliance, procurement, integración, calidad, seguridad, governance)?
- ¿Qué barreras frenan la adopción B2C (saturación de cursos, baja confianza, bajo completion, dificultad de monetizar skills, credenciales débiles)?
- ¿Qué modelos de negocio emergen (suscripción, seats enterprise, outcomes-based, AI tutor, marketplace de expertos, credenciales, agents-as-coaches)?
- ¿Qué señales débiles sugieren cambios no obvios en EdTech, HRTech, productividad, empleo y certificación?
- ¿Qué escenarios plausibles existen para 2027-2030 según velocidad de IA, regulación, adopción empresarial y transformación laboral?
- ¿Qué white spaces aparecen si se separa contenido, tutoría, práctica, evaluación, credencialización y ejecución laboral?
- ¿Qué tendría que ser verdad para que la educación online adulta deje de vender contenido y empiece a vender reducción de time-to-value?
Gates de calidad + evidencia por nodo
Ver tablas D (gates aprobado/rechazado) y E (evidencia mínima) en el audit: .governance/dev/chatgpt-bridge-audit/2026-06-18__conv1-research-orchestration.md. Resumen de los más críticos:
- R06: columnas
id, title, author, year, type, source_url, publisher, doi_isbn, topic_cluster, relevance_score, credibility_score, recency, access_status, obtained_status, notebooklm_status, notes, claims_supported. - R09: 8-12 prompts de sanity check con respuestas citadas + tabla de fuentes que NotebookLM no usa o cita mal.
- R19-R21: cada derivada en tabla (tendencia base → consecuencia → evidencia → incertidumbre).
- R23: escenarios con 2 ejes, drivers, triggers, probabilidades cualitativas, early indicators, riesgos.
- R25: cada claim crítico con 2+ fuentes o marcado
[HIPÓTESIS]. (Guard de procedencia numérica de FUNDAMENTALS.) - R27: red-team checklist (contaminación, fuentes antiguas, sesgo vendor, claims sin evidencia, ausencia de libros, NotebookLM no verificado).
Ground-truth de esta sesión (2026-06-18) — estado real medido
- NotebookLM (id
238984eb): 75 fuentes cargadas y verificadas (notebook_get). Corpus neutral y reciente: libros 2005-2024, informes mercado (WEF Future of Jobs 2025, McKinsey, Deloitte, LinkedIn Learning, EdTech market sizing), papers labor-IA (Anthropic Economic Index, Stanford Canaries, NBER, METR Time Horizon, GDPval, ILO WP140), benchmarks agénticos (SWE-bench, GAIA, τ-bench, OSWorld, WebArena). → La duda del CEO sobre NotebookLM es en gran parte infundada en cuanto a carga; lo que faltaba era el manifest + validación de recuperación (R08/R09). El límite "50 fuentes/notebook" que cita ChatGPT NO aplica aquí (75 cargadas OK → plan superior). - Corpus en disco: 25/50 libros. La meta "50 libros" es un objetivo de disco/repo, distinto de las 75 fuentes de NotebookLM. Descarga bloqueada por cuota hasta medianoche UTC.
- Contaminación medida: 99 menciones "Momentum" en
research/(v1).research/pure/arranca limpio.
Adaptaciones / decisiones abiertas
- OD-007 (Anna's Archive / copyright): ChatGPT (conservador) recomienda NO depender de Anna's Archive para libros con copyright; usar metadata + acceso legal/open-access/compra/préstamo. El mandato CEO autorizó annas-archive y la skill lo enmarca como lectura personal de research. → Decisión de negocio/legal del CEO. Mientras tanto: el Sheet añade columnas
doi_isbn+access_status(legal vs personal-reading) para que la procedencia sea auditable sea cual sea la decisión. Ver.governance/open-decisions.md.