2026-07-05 · DATA ROOM
CogniScout
CogniScout: Investigación Profunda IA. De Horas a Insights en Minutos.
ELEVATOR PITCH
CogniScout automatiza la investigación profunda para analistas y consultores, transformando horas de recopilación manual en informes estructurados y perspicaces en minutos. Con un Health Score del 87% y un impresionante Profit Margin del 90%, estamos listos para escalar y ofrecer un valor excepcional.
VALUE PROPOSITION
Nuestra diferenciación radica en la orquestación de agentes autónomos para generar informes de investigación profundos y estructurados, no solo respuestas rápidas, entregando un producto final adaptado a las necesidades B2B.
EXPLAINER.md
CogniScout — Research Agent
Concepto
CogniScout automatiza la investigacion profunda para analistas de mercado, consultores y product managers. El usuario describe un tema en lenguaje natural; un agente de IA busca en la web, extrae contenido de las paginas relevantes y sintetiza un informe con insights clave y citas a las fuentes originales. Elimina el proceso manual de recopilar y resumir informacion de decenas de pestañas.
Arquitectura
Cliente (SPA/CLI)
|
v
AuthController ----> AuthService ----> UserRepository (JPA)
|
v (JWT Bearer)
ResearchController ---> ResearchProjectRepository (JPA)
|
v (@Async, virtual thread)
ResearchAgentService
|-- WebScraperService (Jsoup + Executors.newVirtualThreadPerTaskExecutor)
|-- LlmSynthesisService (Feign -> LlmClient -> LLM externo, con fallback local)
v
Report (persistido junto al ResearchProject)
- Capas: %%INLINE0%% (REST), %%INLINE1%% (logica de negocio y agente),
dto (records
inmutables para requests/responses), %%INLINE5%% (JWT), %%INLINE6%% (Feign
hacia el LLM), config (seguridad, async, feign, jackson).
- Concurrencia: %%INLINE8%% registra un %%INLINE9%%
Executors.newVirtualThreadPerTaskExecutor() para lanzar N scrapes en
paralelo (uno por URL encontrada), ideal para I/O de red bloqueante sin
agotar hilos de plataforma.
- Persistencia: entidades JPA (%%INLINE13%%, %%INLINE14%%,
Report) se
spring.datasource.* explicito).
- Resiliencia del LLM: si
cogniscout.llm.api-keyno esta configurada
LlmSynthesisService cae a una sintesis local
determinista (concatena extractos + citas) para que el MVP nunca se
bloquee por falta de credenciales externas.
Endpoints
| Metodo | Ruta | Auth | Descripcion |
|---|---|---|---|
| POST | /auth/register | No | Registra un usuario, devuelve JWT |
| POST | /auth/login | No | Autentica, devuelve JWT |
| POST | /api/projects | JWT | Crea un proyecto de investigacion y dispara el agente asincrono |
| GET | /api/projects | JWT | Lista los proyectos del usuario (dashboard) |
| GET | /api/projects/{id} | JWT | Estado de un proyecto (PENDING/RUNNING/COMPLETED/FAILED) |
| GET | /api/projects/{id}/report | JWT | Informe final con resumen y fuentes citadas |
Authorization: Bearer <token> obtenido en login/register.
Referencias (mvpFeatures -> implementacion)
- Creacion de Agentes de Investigacion ->
POST /api/projects+
CreateProjectRequest(topic).
- Busqueda y Extraccion Web Autonoma ->
WebScraperService(DuckDuckGo
- Sintesis y Generacion de Informes ->
LlmSynthesisService+
- Dashboard de Proyectos ->
GET /api/projects(listado) y
GET /api/projects/{id} (estado en vivo) sirven de backend para la UI.
Analisis de Negocio
- Monetizacion: SaaS por niveles. El campo
ProjectStatusy el conteo
ResearchController sin cambios
estructurales.
- ROI medible: cada informe reemplaza horas de investigacion manual;
ResearchProject permite medir
tiempo de entrega del agente frente al proceso manual.
- Barrera de entrada baja: sin dominios regulados (salud/finanzas), el
Como ejecutar
cd solutions/2026-07-05-cogniscout-research-agent
mvn spring-boot:run
Por defecto usa H2 en memoria (sin configuracion adicional). Variables opcionales:
export COGNISCOUT_LLM_BASE_URL=https://api.openai.com/v1
export COGNISCOUT_LLM_API_KEY=sk-...
export COGNISCOUT_LLM_MODEL=gpt-4o-mini
export COGNISCOUT_JWT_SECRET=una-clave-larga-de-al-menos-256-bits
Flujo de prueba rapido:
curl -X POST localhost:8080/auth/register -H 'Content-Type: application/json' \
-d '{"email":"ana@empresa.com","password":"secreta123","fullName":"Ana Analista"}'
curl -X POST localhost:8080/api/projects -H "Authorization: Bearer <token>" \
-H 'Content-Type: application/json' \
-d '{"topic":"Tendencias de agentes de IA para investigacion profunda en 2026"}'
curl localhost:8080/api/projects/1 -H "Authorization: Bearer <token>"
curl localhost:8080/api/projects/1/report -H "Authorization: Bearer <token>"
FinOps Analysis para CogniScout
Resumen de Costos y Rentabilidad
CogniScout, con su enfoque en la automatización de la investigación, presenta un modelo de negocio con un alto potencial de rentabilidad debido a los bajos costos operativos esperados para una micro-startup.
- Ingresos Mensuales Estimados: $500 (basado en 20 clientes pagando un promedio de $25/mes).
- Costos Operativos Mensuales Estimados: $50
- Margen de Beneficio Estimado: 90%
Desglose de Costos Detallado
1. Estimación de Uso de LLM y Costos
Se estima un uso mensual de ~3 millones de tokens, utilizando principalmente gpt-4o-mini por su excelente relación costo-rendimiento. Esta estimación considera un promedio de 230 informes generados al mes (una mezcla de usuarios del plan gratuito y de pago), con cada informe procesando aproximadamente 12,500 tokens (entrada y salida).
Aunque el costo directo de gpt-4o-mini para este volumen sería inferior a $1, se ha asignado un presupuesto de $15/mes para las APIs de LLM. Este buffer permite:
- Un margen de error en la estimación de tokens.
- El uso ocasional de modelos más potentes como
gpt-4opara tareas de síntesis críticas en planes premium. - Posibles iteraciones o prompts más complejos que requieran más tokens.
2. Costos de Infraestructura Cloud
Para una micro-startup, se recomienda una configuración lean en un proveedor de nube como Google Cloud Platform (GCP) para mantener los costos bajos:
- Máquina Virtual (VM) para la aplicación Spring Boot: Una instancia
e2-small($12-15/mes) es suficiente para el MVP, manejando la API y orquestando los agentes. - Base de Datos PostgreSQL: Una instancia
Cloud SQL db-f1-micro($10-15/mes) proporciona una base de datos gestionada y escalable con un costo inicial bajo.
3. Otros Costos
- APIs Externas: No se identifican costos significativos adicionales para APIs externas más allá de OpenAI en el MVP. La extracción web se realizará con Jsoup, sin depender de APIs de búsqueda de pago.
- CDN/Monitoring: No se consideran costos adicionales para CDN en el MVP. El monitoreo básico de la nube está incluido o es de bajo costo.
Estrategias de Optimización FinOps
Para mantener este alto margen de beneficio y escalar de manera eficiente, CogniScout debe implementar las siguientes estrategias FinOps:
- Caché de Respuestas LLM y Contenido Web: Implementar un sistema de caché para almacenar resultados de LLM y contenido web previamente raspado. Esto reduce las llamadas redundantes a la API del LLM y el tráfico de scraping, disminuyendo significativamente los costos recurrentes.
- Optimización Agresiva de Tokens: Antes de enviar contenido al LLM, realizar un pre-procesamiento exhaustivo. Esto incluye resumir grandes bloques de texto, filtrar información irrelevante y utilizar embeddings para enviar solo los fragmentos más relevantes, minimizando la cantidad de tokens de entrada.
- Tiering Inteligente de Modelos LLM: Designar %%INLINE44%% como el modelo predeterminado para la mayoría de las operaciones, especialmente en el plan gratuito y Pro. Reservar el uso de %%INLINE45%% (más caro) estrictamente para las funcionalidades de 'investigación profunda' o 'insights avanzados' del plan Business, donde el valor añadido justifica el costo.
- Exploración de Serverless para Workers: Migrar los agentes de investigación asíncronos a un modelo serverless (ej., AWS Lambda o GCP Cloud Functions). Esto permite pagar solo por el tiempo de ejecución real de los agentes, eliminando los costos de una VM dedicada que podría estar ociosa.
- Right-Sizing Continuo de la Infraestructura: Monitorizar el uso de CPU, memoria y E/S de la base de datos y la VM. Ajustar el tamaño de las instancias a la demanda real, utilizando instancias burstables como %%INLINE46%% o %%INLINE47%% que son ideales para cargas de trabajo variables de startups.
- Scraping Eficiente: Implementar una lógica de scraping que minimice el tráfico de red. Esto incluye respetar
robots.txt, evitar la descarga de activos innecesarios (imágenes, CSS) y priorizar la extracción de texto relevante sobre la descarga completa de páginas, reduciendo costos de transferencia de datos y procesamiento. - Batch Processing: Para tareas de investigación que no requieren inmediatez, considerar el procesamiento por lotes durante horas de menor actividad. Esto puede optimizar el uso de recursos y potencialmente aprovechar tarifas de cómputo más bajas si el proveedor de la nube las ofrece.
MVP FEATURES
- 01Creación de Agentes de Investigación: El usuario define un tema de investigación a través de una simple consulta en lenguaje natural.
- 02Búsqueda y Extracción Web Autónoma: El agente realiza búsquedas en la web, sigue enlaces relevantes y extrae contenido textual de las páginas clave.
- 03Síntesis y Generación de Informes: Utiliza un LLM para analizar el contenido recopilado, identificar insights clave y generar un informe resumido con citas y enlaces a las fuentes originales.
- 04Dashboard de Proyectos: Una interfaz de usuario para iniciar nuevas investigaciones, monitorear el progreso de los agentes activos y acceder a los informes históricos.
“Transforma horas de investigación manual en minutos de insights accionables con la IA de CogniScout.”
Revisad el MVP, especialmente las validaciones de entrada, y preparemos el pitch para la ronda Pre-Seed.
CertiCopy AI
90CertiCopy AI es la solución de IA que genera descripciones de producto atractivas y conformes para equipos de marketing en industrias reguladas. Resolvemos el costoso problema del incumplimiento normativo, acelerando lanzamientos y mitigando riesgos legales, con un robusto Health Score del 87% y un impresionante Profit Margin del 84%.
CertifyContent AI
88CertifyContent AI es un copiloto de IA que transforma la creación de descripciones de producto para industrias reguladas, garantizando cumplimiento y atractivo comercial. Con un Health Score del 87% y un Profit Margin del 89%, minimizamos riesgos legales y aceleramos el time-to-market para equipos de marketing y cumplimiento.
Redact AI
88Redact AI ofrece un microservicio API-first para que CTOs y Jefes de Ingeniería implementen el 'derecho al olvido' en sus modelos de IA, eliminando datos de usuario de forma segura. Con un Health Score del 84% y un margen de beneficio del 94%, garantizamos cumplimiento normativo, reducimos costes operativos y aceleramos la innovación sin reentrenamientos completos.