Saltar al contenido principal

Research Protocol v2 — RESEARCH PURO (capa neutral, SIN Momentum)

Canónico. Supersede research/research-plan.md (v1, contaminado con Momentum — 99 menciones medidas 2026-06-18). Origen: orquestación ChatGPT (conv 6a32cf87, modo n8n exigente) + post-mortem CEO + ground-truth de esta sesión. Regla nuclear: este documento y todo lo que cuelga de research/pure/ describe el MUNDO (mercado, tendencias, IA, aprendizaje adulto). NO vende ni diseña una solución. Momentum NO aparece. Momentum vive en la capa 2 (paper de visión), que consume este research ya locked.

Causa raíz de los 3 fallos (diagnóstico, no síntoma)

  1. Research contaminado = no había firewall semántica entre dos trabajos distintos (investigación neutral de mercado vs narrativa de producto). Se mezclaron evidencia, interpretación y posicionamiento → el research dejó de ser creíble como informe externo.
  2. Journal pobre = se trató como entregable final, no como log operativo obligatorio por nodo. El rationale no capturado en el momento de decidir se reconstruye superficial.
  3. Corpus insuficiente / NotebookLM dudoso = faltó capa de corpus operations (criterios por tipo de fuente, status documental, trazabilidad, prueba de consulta). 25 fuentes = muestra, no corpus estratégico. "Subido a NotebookLM" no es verificable sin manifest + conteo + sanity prompts con citas.
  • Causa sistémica común: se trabajó como producción de contenido, no como pipeline de investigación auditable.

Secuencia macro (INVIOLABLE)

RESEARCH PURO (locked)Paper de visión MomentumMarketing / Landing / Repo. El mandato original mezcló 4 trabajos (research neutral · corpus ops · journal/sistema de pensamiento · visión/marca/producto) y la 1ª pasada los ejecutó como uno solo. Aquí se separan.

Grafo de nodos (R00–R28)

Regla base de gate: un nodo sin criterio de verificación queda rechazado por defecto.

idobjetivooutputdependencias
R00_SCOPE_FIREWALLFrontera del research neutral + lenguaje prohibidoscope memo (ver R00-scope-firewall.md)
R01_RESEARCH_PROTOCOLMétodo, taxonomía de fuentes, pesos de evidencia, plantilla de evaluacióneste documentoR00
R02_QUESTION_TREEMandato → research questions neutrales MECEárbol de preguntas (§RQ)R01
R03_SOURCE_DISCOVERYUniverso inicial de fuentes 2024-2026longlist 100-150R02
R04_BOOK_CORPUSSubcorpus de libros/monografías (corregir gap)libros con status legal/disponibilidad/prioridadR03
R05_SOURCE_SCREENINGFiltrar por calidad/relevancia/no-redundanciashortlist 50-70R03,R04
R06_BIBLIOGRAPHY_SHEETSheet maestro bibliografía + estado documentalSheet (schema en bibliography-schema.md)R05
R07_DOCUMENT_ACQUISITIONObtener legalmente el máximo de documentoscarpeta corpus + statusR06
R08_NOTEBOOKLM_LOADCargar/particionar corpus en NotebookLMnotebook(s) + manifest + prueba de conteoR07
R09_NOTEBOOKLM_VALIDATIONVerificar recuperación desde fuentes cargadassanity checks con citas + gapsR08
R10_MARKET_MAPMapa de mercado educación online adulta B2B+B2Ctaxonomía segmentos/compradores/formatos/modelosR05-R09
R11_DEMAND_JTBDDemanda: jobs-to-be-done adultos/empresas/L&Dmapa necesidades/fricciones/WTPR10
R12_SUPPLY_COMPETITIONOferta: EdTech/L&D/bootcamps/universidades/plataformas IAlandscape por categorías (no marcas favoritas)R10
R13_AI_AGENT_FRONTIERQué permiten IA/agentes en educación/trabajo adultomatriz capacidad→caso→evidencia→límiteR09
R14_LEARNING_SCIENCECiencia del aprendizaje adultoprincipios validados (retención, transferencia, práctica deliberada)R09
R15_ENTERPRISE_ADOPTIONAdopción enterprise: procurement/compliance/ROI/governancebarreras + aceleradores B2BR10,R13
R16_B2C_ADOPTIONAdopción individual: motivación/abandono/credenciales/pricingbarreras + aceleradores B2CR10,R14
R17_BUSINESS_MODELSModelos de negocio y unit economicspatrones de monetización comparadosR12,R15,R16
R18_LABOUR_MARKET_IMPACTImpacto IA en tareas/skills/roles/empleabilidadmapa tareas afectadas / reskilling / nuevos rolesR13
R19_SECOND_DERIVATIVE2ª derivada: capacidades IA → rediseño de tareas/workflowstesis de 2º ordenR13,R18
R20_THIRD_DERIVATIVE3ª derivada: workflows → puestos/roles/estructura orgtesis de 3er ordenR19
R21_FOURTH_DERIVATIVE4ª derivada: roles → mercado educativo/credenciales/regulacióntesis de 4º ordenR20
R22_WEAK_SIGNALSSerendipia: señales no aparentes, patrones adyacentesseñales débiles priorizadas + cómo se verificaríanR10-R21
R23_SCENARIOS_2027_2030Escenarios IA 2027/28/29/303-4 escenarios con drivers/triggers/early indicatorsR19-R22
R24_STRATEGIC_IMPLICATIONS_NEUTRALImplicaciones sin solución concretaoportunidades/riesgos/white spaces (confianza graduada)R10-R23
R25_RESEARCH_REPORTInforme final de research puroinforme consulting (exec summary, findings, evidence, escenarios, appendices)R24
R26_JOURNAL_BOOKTodo el proceso como libro/journalHTML book journal (decisiones, rationale, cambios de opinión, rejected paths)todos
R27_RED_TEAM_QAAuditar contaminación/fuentes/razonamiento/claimsQA report aprobado/rechazado por nodoR25,R26,R06
R28_FINAL_RESEARCH_LOCKCongelar research puroversión locked + changelog + bibliografía finalR27

Research questions neutrales (R02) — sin Momentum

  1. ¿Cómo evoluciona el mercado global de educación online de adultos entre B2C, B2B y formación corporativa?
  2. ¿Qué problemas estructurales siguen sin resolverse (abandono, transferencia al trabajo, motivación, personalización, acreditación, ROI, confianza)?
  3. ¿Qué segmentos de adultos aprenden online y con qué jobs-to-be-done (promoción, cambio de carrera, productividad, emprendimiento, compliance, up/reskilling)?
  4. ¿Cómo compran las empresas formación 2024-2026 (quién decide, quién paga, qué métricas exige, qué objeciones bloquean)?
  5. ¿Cómo compran los individuos (qué pagan, qué abandonan, qué perciben como valor, qué formatos retienen mejor)?
  6. ¿Qué impacto real tienen IA generativa y agentes en creación, personalización, evaluación y entrega educativa?
  7. ¿Dónde la IA mejora el aprendizaje y dónde solo abarata la producción de contenido sin mejorar resultados?
  8. ¿Qué evidencia existe sobre aprendizaje adulto, práctica deliberada, feedback, transferencia al puesto, aprendizaje situado?
  9. ¿Qué modelos de aprendizaje son más robustos para adultos (cohorte, self-paced, tutoría, simulación, proyectos, comunidades, workplace, blended)?
  10. ¿Cómo cambia la formación corporativa cuando el output esperado no es "saber" sino "hacer algo útil en el trabajo"?
  11. ¿Qué nuevas formas de evaluación, credencialización y proof-of-work emergen cuando la IA puede producir parte del output?
  12. ¿Qué tareas cognitivas están siendo aumentadas o automatizadas por IA y qué implica para la formación adulta?
  13. ¿Qué puestos se exponen a sustitución parcial y cuáles se transforman por augmentación?
  14. ¿Qué nuevos roles humanos aparecen alrededor de la IA (supervisión, validación, diseño de workflows, gestión de agentes, contexto, gobernanza)?
  15. ¿Qué capacidades humanas se vuelven más escasas (juicio, framing, criterio, transferencia, ética, comunicación, gestión de ambigüedad)?
  16. ¿Qué barreras frenan la adopción enterprise (privacidad, compliance, procurement, integración, calidad, seguridad, governance)?
  17. ¿Qué barreras frenan la adopción B2C (saturación de cursos, baja confianza, bajo completion, dificultad de monetizar skills, credenciales débiles)?
  18. ¿Qué modelos de negocio emergen (suscripción, seats enterprise, outcomes-based, AI tutor, marketplace de expertos, credenciales, agents-as-coaches)?
  19. ¿Qué señales débiles sugieren cambios no obvios en EdTech, HRTech, productividad, empleo y certificación?
  20. ¿Qué escenarios plausibles existen para 2027-2030 según velocidad de IA, regulación, adopción empresarial y transformación laboral?
  21. ¿Qué white spaces aparecen si se separa contenido, tutoría, práctica, evaluación, credencialización y ejecución laboral?
  22. ¿Qué tendría que ser verdad para que la educación online adulta deje de vender contenido y empiece a vender reducción de time-to-value?

Gates de calidad + evidencia por nodo

Ver tablas D (gates aprobado/rechazado) y E (evidencia mínima) en el audit: .governance/dev/chatgpt-bridge-audit/2026-06-18__conv1-research-orchestration.md. Resumen de los más críticos:

  • R06: columnas id, title, author, year, type, source_url, publisher, doi_isbn, topic_cluster, relevance_score, credibility_score, recency, access_status, obtained_status, notebooklm_status, notes, claims_supported.
  • R09: 8-12 prompts de sanity check con respuestas citadas + tabla de fuentes que NotebookLM no usa o cita mal.
  • R19-R21: cada derivada en tabla (tendencia base → consecuencia → evidencia → incertidumbre).
  • R23: escenarios con 2 ejes, drivers, triggers, probabilidades cualitativas, early indicators, riesgos.
  • R25: cada claim crítico con 2+ fuentes o marcado [HIPÓTESIS]. (Guard de procedencia numérica de FUNDAMENTALS.)
  • R27: red-team checklist (contaminación, fuentes antiguas, sesgo vendor, claims sin evidencia, ausencia de libros, NotebookLM no verificado).

Ground-truth de esta sesión (2026-06-18) — estado real medido

  • NotebookLM (id 238984eb): 75 fuentes cargadas y verificadas (notebook_get). Corpus neutral y reciente: libros 2005-2024, informes mercado (WEF Future of Jobs 2025, McKinsey, Deloitte, LinkedIn Learning, EdTech market sizing), papers labor-IA (Anthropic Economic Index, Stanford Canaries, NBER, METR Time Horizon, GDPval, ILO WP140), benchmarks agénticos (SWE-bench, GAIA, τ-bench, OSWorld, WebArena). → La duda del CEO sobre NotebookLM es en gran parte infundada en cuanto a carga; lo que faltaba era el manifest + validación de recuperación (R08/R09). El límite "50 fuentes/notebook" que cita ChatGPT NO aplica aquí (75 cargadas OK → plan superior).
  • Corpus en disco: 25/50 libros. La meta "50 libros" es un objetivo de disco/repo, distinto de las 75 fuentes de NotebookLM. Descarga bloqueada por cuota hasta medianoche UTC.
  • Contaminación medida: 99 menciones "Momentum" en research/ (v1). research/pure/ arranca limpio.

Adaptaciones / decisiones abiertas

  • OD-007 (Anna's Archive / copyright): ChatGPT (conservador) recomienda NO depender de Anna's Archive para libros con copyright; usar metadata + acceso legal/open-access/compra/préstamo. El mandato CEO autorizó annas-archive y la skill lo enmarca como lectura personal de research. → Decisión de negocio/legal del CEO. Mientras tanto: el Sheet añade columnas doi_isbn + access_status (legal vs personal-reading) para que la procedencia sea auditable sea cual sea la decisión. Ver .governance/open-decisions.md.