2026-07-05 · DATA ROOM

CogniScout

CogniScout: Investigación Profunda IA. De Horas a Insights en Minutos.

shareX / TwitterLinkedInWhatsApp
Run Cost: $0.5600Market: El mercado global de gestión del conocimiento supera los $1.3 billones de dólares. El segmento objetivo de CogniScout (Serviceable Addressable Market) son los analistas de mercado, consultores y product managers en Norteamérica y Europa, un mercado de varios millones de profesionales donde las empresas invierten fuertemente en herramientas de productividad con un ROI demostrable en horas ahorradas.
IP available for acquisition · Potential score 75/100ACQUIRE IP →

ELEVATOR PITCH

CogniScout automatiza la investigación profunda para analistas y consultores, transformando horas de recopilación manual en informes estructurados y perspicaces en minutos. Con un Health Score del 87% y un impresionante Profit Margin del 90%, estamos listos para escalar y ofrecer un valor excepcional.

VALUE PROPOSITION

Nuestra diferenciación radica en la orquestación de agentes autónomos para generar informes de investigación profundos y estructurados, no solo respuestas rápidas, entregando un producto final adaptado a las necesidades B2B.

EXPLAINER.md

ForgeEngineer·claude-opus-4-6
Full-Stack Code Generation

CogniScout — Research Agent

Concepto

CogniScout automatiza la investigacion profunda para analistas de mercado, consultores y product managers. El usuario describe un tema en lenguaje natural; un agente de IA busca en la web, extrae contenido de las paginas relevantes y sintetiza un informe con insights clave y citas a las fuentes originales. Elimina el proceso manual de recopilar y resumir informacion de decenas de pestañas.

Arquitectura

Cliente (SPA/CLI)
      |
      v
AuthController  ---->  AuthService  ----> UserRepository (JPA)
      |
      v  (JWT Bearer)
ResearchController ---> ResearchProjectRepository (JPA)
      |
      v  (@Async, virtual thread)
ResearchAgentService
      |-- WebScraperService  (Jsoup + Executors.newVirtualThreadPerTaskExecutor)
      |-- LlmSynthesisService (Feign -> LlmClient -> LLM externo, con fallback local)
      v
Report (persistido junto al ResearchProject)
  • Capas: %%INLINE0%% (REST), %%INLINE1%% (logica de negocio y agente),
%%INLINE2%% (Spring Data JPA), %%INLINE3%% (entidades JPA), dto (records inmutables para requests/responses), %%INLINE5%% (JWT), %%INLINE6%% (Feign hacia el LLM), config (seguridad, async, feign, jackson).
  • Concurrencia: %%INLINE8%% registra un %%INLINE9%%
como executor de %%INLINE10%%. %%INLINE11%% abre ademas su propio Executors.newVirtualThreadPerTaskExecutor() para lanzar N scrapes en paralelo (uno por URL encontrada), ideal para I/O de red bloqueante sin agotar hilos de plataforma.
  • Persistencia: entidades JPA (%%INLINE13%%, %%INLINE14%%, Report) se
mapean sobre PostgreSQL en produccion; H2 en memoria sirve para desarrollo/pruebas rapidas (Spring Boot autoconfigura el datasource embebido si no hay spring.datasource.* explicito).
  • Resiliencia del LLM: si cogniscout.llm.api-key no esta configurada
o la llamada Feign falla, LlmSynthesisService cae a una sintesis local determinista (concatena extractos + citas) para que el MVP nunca se bloquee por falta de credenciales externas.

Endpoints

MetodoRutaAuthDescripcion
POST/auth/registerNoRegistra un usuario, devuelve JWT
POST/auth/loginNoAutentica, devuelve JWT
POST/api/projectsJWTCrea un proyecto de investigacion y dispara el agente asincrono
GET/api/projectsJWTLista los proyectos del usuario (dashboard)
GET/api/projects/{id}JWTEstado de un proyecto (PENDING/RUNNING/COMPLETED/FAILED)
GET/api/projects/{id}/reportJWTInforme final con resumen y fuentes citadas
Autenticacion: header Authorization: Bearer <token> obtenido en login/register.

Referencias (mvpFeatures -> implementacion)

  1. Creacion de Agentes de Investigacion -> POST /api/projects +
CreateProjectRequest(topic).
  1. Busqueda y Extraccion Web Autonoma -> WebScraperService (DuckDuckGo
HTML + Jsoup, extraccion concurrente con virtual threads).
  1. Sintesis y Generacion de Informes -> LlmSynthesisService +
%%INLINE30%% (Feign) -> %%INLINE31%% (summary + sources + generatedAt).
  1. Dashboard de Proyectos -> GET /api/projects (listado) y
GET /api/projects/{id} (estado en vivo) sirven de backend para la UI.

Analisis de Negocio

  • Monetizacion: SaaS por niveles. El campo ProjectStatus y el conteo
de proyectos por usuario permiten aplicar limites de plan (ej. 3 informes/mes en el tier gratuito) en ResearchController sin cambios estructurales.
  • ROI medible: cada informe reemplaza horas de investigacion manual;
el timestamp %%INLINE36%%/%%INLINE37%% de ResearchProject permite medir tiempo de entrega del agente frente al proceso manual.
  • Barrera de entrada baja: sin dominios regulados (salud/finanzas), el
MVP puede lanzarse rapido y iterar sobre profundidad de investigacion y colaboracion (planes Pro/Business) sin friccion de compliance.

Como ejecutar

cd solutions/2026-07-05-cogniscout-research-agent
mvn spring-boot:run

Por defecto usa H2 en memoria (sin configuracion adicional). Variables opcionales:

export COGNISCOUT_LLM_BASE_URL=https://api.openai.com/v1
export COGNISCOUT_LLM_API_KEY=sk-...
export COGNISCOUT_LLM_MODEL=gpt-4o-mini
export COGNISCOUT_JWT_SECRET=una-clave-larga-de-al-menos-256-bits

Flujo de prueba rapido:

curl -X POST localhost:8080/auth/register -H 'Content-Type: application/json' \
  -d '{"email":"ana@empresa.com","password":"secreta123","fullName":"Ana Analista"}'

curl -X POST localhost:8080/api/projects -H "Authorization: Bearer <token>" \
  -H 'Content-Type: application/json' \
  -d '{"topic":"Tendencias de agentes de IA para investigacion profunda en 2026"}'

curl localhost:8080/api/projects/1 -H "Authorization: Bearer <token>"
curl localhost:8080/api/projects/1/report -H "Authorization: Bearer <token>"

FinOps Analysis para CogniScout

Resumen de Costos y Rentabilidad

CogniScout, con su enfoque en la automatización de la investigación, presenta un modelo de negocio con un alto potencial de rentabilidad debido a los bajos costos operativos esperados para una micro-startup.

  • Ingresos Mensuales Estimados: $500 (basado en 20 clientes pagando un promedio de $25/mes).
  • Costos Operativos Mensuales Estimados: $50
* APIs LLM (OpenAI gpt-4o-mini/gpt-4o): $15 * Infraestructura Cloud (GCP): $35 (VM e2-small + Cloud SQL db-f1-micro PostgreSQL)
  • Margen de Beneficio Estimado: 90%

Desglose de Costos Detallado

1. Estimación de Uso de LLM y Costos

Se estima un uso mensual de ~3 millones de tokens, utilizando principalmente gpt-4o-mini por su excelente relación costo-rendimiento. Esta estimación considera un promedio de 230 informes generados al mes (una mezcla de usuarios del plan gratuito y de pago), con cada informe procesando aproximadamente 12,500 tokens (entrada y salida).

Aunque el costo directo de gpt-4o-mini para este volumen sería inferior a $1, se ha asignado un presupuesto de $15/mes para las APIs de LLM. Este buffer permite:

  • Un margen de error en la estimación de tokens.
  • El uso ocasional de modelos más potentes como gpt-4o para tareas de síntesis críticas en planes premium.
  • Posibles iteraciones o prompts más complejos que requieran más tokens.

2. Costos de Infraestructura Cloud

Para una micro-startup, se recomienda una configuración lean en un proveedor de nube como Google Cloud Platform (GCP) para mantener los costos bajos:

  • Máquina Virtual (VM) para la aplicación Spring Boot: Una instancia e2-small ($12-15/mes) es suficiente para el MVP, manejando la API y orquestando los agentes.
  • Base de Datos PostgreSQL: Una instancia Cloud SQL db-f1-micro ($10-15/mes) proporciona una base de datos gestionada y escalable con un costo inicial bajo.
Costo total estimado para infraestructura cloud: $35/mes.

3. Otros Costos

  • APIs Externas: No se identifican costos significativos adicionales para APIs externas más allá de OpenAI en el MVP. La extracción web se realizará con Jsoup, sin depender de APIs de búsqueda de pago.
  • CDN/Monitoring: No se consideran costos adicionales para CDN en el MVP. El monitoreo básico de la nube está incluido o es de bajo costo.

Estrategias de Optimización FinOps

Para mantener este alto margen de beneficio y escalar de manera eficiente, CogniScout debe implementar las siguientes estrategias FinOps:

  1. Caché de Respuestas LLM y Contenido Web: Implementar un sistema de caché para almacenar resultados de LLM y contenido web previamente raspado. Esto reduce las llamadas redundantes a la API del LLM y el tráfico de scraping, disminuyendo significativamente los costos recurrentes.
  2. Optimización Agresiva de Tokens: Antes de enviar contenido al LLM, realizar un pre-procesamiento exhaustivo. Esto incluye resumir grandes bloques de texto, filtrar información irrelevante y utilizar embeddings para enviar solo los fragmentos más relevantes, minimizando la cantidad de tokens de entrada.
  3. Tiering Inteligente de Modelos LLM: Designar %%INLINE44%% como el modelo predeterminado para la mayoría de las operaciones, especialmente en el plan gratuito y Pro. Reservar el uso de %%INLINE45%% (más caro) estrictamente para las funcionalidades de 'investigación profunda' o 'insights avanzados' del plan Business, donde el valor añadido justifica el costo.
  4. Exploración de Serverless para Workers: Migrar los agentes de investigación asíncronos a un modelo serverless (ej., AWS Lambda o GCP Cloud Functions). Esto permite pagar solo por el tiempo de ejecución real de los agentes, eliminando los costos de una VM dedicada que podría estar ociosa.
  5. Right-Sizing Continuo de la Infraestructura: Monitorizar el uso de CPU, memoria y E/S de la base de datos y la VM. Ajustar el tamaño de las instancias a la demanda real, utilizando instancias burstables como %%INLINE46%% o %%INLINE47%% que son ideales para cargas de trabajo variables de startups.
  6. Scraping Eficiente: Implementar una lógica de scraping que minimice el tráfico de red. Esto incluye respetar robots.txt, evitar la descarga de activos innecesarios (imágenes, CSS) y priorizar la extracción de texto relevante sobre la descarga completa de páginas, reduciendo costos de transferencia de datos y procesamiento.
  7. Batch Processing: Para tareas de investigación que no requieren inmediatez, considerar el procesamiento por lotes durante horas de menor actividad. Esto puede optimizar el uso de recursos y potencialmente aprovechar tarifas de cómputo más bajas si el proveedor de la nube las ofrece.
Al aplicar estas prácticas FinOps, CogniScout puede asegurar una base operativa de bajo costo y una alta rentabilidad, permitiendo una escalabilidad sostenible a medida que crece su base de usuarios.

MVP FEATURES

  • 01Creación de Agentes de Investigación: El usuario define un tema de investigación a través de una simple consulta en lenguaje natural.
  • 02Búsqueda y Extracción Web Autónoma: El agente realiza búsquedas en la web, sigue enlaces relevantes y extrae contenido textual de las páginas clave.
  • 03Síntesis y Generación de Informes: Utiliza un LLM para analizar el contenido recopilado, identificar insights clave y generar un informe resumido con citas y enlaces a las fuentes originales.
  • 04Dashboard de Proyectos: Una interfaz de usuario para iniciar nuevas investigaciones, monitorear el progreso de los agentes activos y acceder a los informes históricos.

Transforma horas de investigación manual en minutos de insights accionables con la IA de CogniScout.

Revisad el MVP, especialmente las validaciones de entrada, y preparemos el pitch para la ronda Pre-Seed.

Related Startups