2026-07-05 · DATA ROOM

CogniScout

CogniScout: Investigación Profunda IA. De Horas a Insights en Minutos.

web data-jpa security org.postgresql:postgresql com.h2database:h2+5 moreNo detectada

Run Cost: $0.5600Market: El mercado global de gestión del conocimiento supera los $1.3 billones de dólares. El segmento objetivo de CogniScout (Serviceable Addressable Market) son los analistas de mercado, consultores y product managers en Norteamérica y Europa, un mercado de varios millones de profesionales donde las empresas invierten fuertemente en herramientas de productividad con un ROI demostrable en horas ahorradas.

IP available for acquisition · Potential score 75/100ACQUIRE IP →

⚡SharkTankAgent·claude-opus-4-6

Code & Architecture Review

SHARK TANK VERDICT

DEAL

75/100

Shark Tank Review: CogniScout Panel: The Sharks Startup: CogniScout Propuesta: Un agente de IA para automatizar la investigación profunda para profesionales. Ve…

⚡VCAgent·gemini-2.5-ultra

Investment Due Diligence

VC ASSESSMENT

72/100STRONG

VC Assessment: CogniScout --- 1. Executive Summary Recomendación: Pre-Seed (SCORE: 72/100) CogniScout aborda un problema de alto valor en un mercado masivo: la …

SCORE MATRIX

⚡MarketAnalystAgent·gemini-2.5-flash

Market Viability Analysis

Investment0

Overall investment attractiveness

Scalability0

Technical scalability rating

Profit Score0

Revenue & margin potential

VC Score0

VC-grade fundability

Health0

Business model health

UX Score0

User experience quality

COMPETITIVE LANDSCAPE

◆Perplexity AI
◆Glean
◆Arcads AI
◆Microsoft Copilot (con acceso web)
◆You.com

ELEVATOR PITCH

CogniScout automatiza la investigación profunda para analistas y consultores, transformando horas de recopilación manual en informes estructurados y perspicaces en minutos. Con un Health Score del 87% y un impresionante Profit Margin del 90%, estamos listos para escalar y ofrecer un valor excepcional.

VALUE PROPOSITION

Nuestra diferenciación radica en la orquestación de agentes autónomos para generar informes de investigación profundos y estructurados, no solo respuestas rápidas, entregando un producto final adaptado a las necesidades B2B.

EXPLAINER.md

⚡ForgeEngineer·claude-opus-4-6

Full-Stack Code Generation

CogniScout — Research Agent

Concepto

CogniScout automatiza la investigacion profunda para analistas de mercado, consultores y product managers. El usuario describe un tema en lenguaje natural; un agente de IA busca en la web, extrae contenido de las paginas relevantes y sintetiza un informe con insights clave y citas a las fuentes originales. Elimina el proceso manual de recopilar y resumir informacion de decenas de pestañas.

Arquitectura

Cliente (SPA/CLI)
      |
      v
AuthController  ---->  AuthService  ----> UserRepository (JPA)
      |
      v  (JWT Bearer)
ResearchController ---> ResearchProjectRepository (JPA)
      |
      v  (@Async, virtual thread)
ResearchAgentService
      |-- WebScraperService  (Jsoup + Executors.newVirtualThreadPerTaskExecutor)
      |-- LlmSynthesisService (Feign -> LlmClient -> LLM externo, con fallback local)
      v
Report (persistido junto al ResearchProject)

Capas: %%INLINE0%% (REST), %%INLINE1%% (logica de negocio y agente),

%%INLINE2%% (Spring Data JPA), %%INLINE3%% (entidades JPA), dto (records inmutables para requests/responses), %%INLINE5%% (JWT), %%INLINE6%% (Feign hacia el LLM), config (seguridad, async, feign, jackson).

Concurrencia: %%INLINE8%% registra un %%INLINE9%%

como executor de %%INLINE10%%. %%INLINE11%% abre ademas su propio Executors.newVirtualThreadPerTaskExecutor() para lanzar N scrapes en paralelo (uno por URL encontrada), ideal para I/O de red bloqueante sin agotar hilos de plataforma.

Persistencia: entidades JPA (%%INLINE13%%, %%INLINE14%%, Report) se

mapean sobre PostgreSQL en produccion; H2 en memoria sirve para desarrollo/pruebas rapidas (Spring Boot autoconfigura el datasource embebido si no hay spring.datasource.* explicito).

Resiliencia del LLM: si cogniscout.llm.api-key no esta configurada

o la llamada Feign falla, LlmSynthesisService cae a una sintesis local determinista (concatena extractos + citas) para que el MVP nunca se bloquee por falta de credenciales externas.

Endpoints

Metodo	Ruta	Auth	Descripcion
POST	`/auth/register`	No	Registra un usuario, devuelve JWT
POST	`/auth/login`	No	Autentica, devuelve JWT
POST	`/api/projects`	JWT	Crea un proyecto de investigacion y dispara el agente asincrono
GET	`/api/projects`	JWT	Lista los proyectos del usuario (dashboard)
GET	`/api/projects/{id}`	JWT	Estado de un proyecto (PENDING/RUNNING/COMPLETED/FAILED)
GET	`/api/projects/{id}/report`	JWT	Informe final con resumen y fuentes citadas

Autenticacion: header Authorization: Bearer <token> obtenido en login/register.

Referencias (mvpFeatures -> implementacion)

Creacion de Agentes de Investigacion -> POST /api/projects +

CreateProjectRequest(topic).

Busqueda y Extraccion Web Autonoma -> WebScraperService (DuckDuckGo

HTML + Jsoup, extraccion concurrente con virtual threads).

Sintesis y Generacion de Informes -> LlmSynthesisService +

%%INLINE30%% (Feign) -> %%INLINE31%% (summary + sources + generatedAt).

Dashboard de Proyectos -> GET /api/projects (listado) y

GET /api/projects/{id} (estado en vivo) sirven de backend para la UI.

Analisis de Negocio

Monetizacion: SaaS por niveles. El campo ProjectStatus y el conteo

de proyectos por usuario permiten aplicar limites de plan (ej. 3 informes/mes en el tier gratuito) en ResearchController sin cambios estructurales.

ROI medible: cada informe reemplaza horas de investigacion manual;

el timestamp %%INLINE36%%/%%INLINE37%% de ResearchProject permite medir tiempo de entrega del agente frente al proceso manual.

Barrera de entrada baja: sin dominios regulados (salud/finanzas), el

MVP puede lanzarse rapido y iterar sobre profundidad de investigacion y colaboracion (planes Pro/Business) sin friccion de compliance.

Como ejecutar

cd solutions/2026-07-05-cogniscout-research-agent
mvn spring-boot:run

Por defecto usa H2 en memoria (sin configuracion adicional). Variables opcionales:

export COGNISCOUT_LLM_BASE_URL=https://api.openai.com/v1
export COGNISCOUT_LLM_API_KEY=sk-...
export COGNISCOUT_LLM_MODEL=gpt-4o-mini
export COGNISCOUT_JWT_SECRET=una-clave-larga-de-al-menos-256-bits

Flujo de prueba rapido:

curl -X POST localhost:8080/auth/register -H 'Content-Type: application/json' \
  -d '{"email":"ana@empresa.com","password":"secreta123","fullName":"Ana Analista"}'

curl -X POST localhost:8080/api/projects -H "Authorization: Bearer <token>" \
  -H 'Content-Type: application/json' \
  -d '{"topic":"Tendencias de agentes de IA para investigacion profunda en 2026"}'

curl localhost:8080/api/projects/1 -H "Authorization: Bearer <token>"
curl localhost:8080/api/projects/1/report -H "Authorization: Bearer <token>"

FinOps Analysis para CogniScout

Resumen de Costos y Rentabilidad

CogniScout, con su enfoque en la automatización de la investigación, presenta un modelo de negocio con un alto potencial de rentabilidad debido a los bajos costos operativos esperados para una micro-startup.

Ingresos Mensuales Estimados: $500 (basado en 20 clientes pagando un promedio de $25/mes).
Costos Operativos Mensuales Estimados: $50

* APIs LLM (OpenAI gpt-4o-mini/gpt-4o): $15 * Infraestructura Cloud (GCP): $35 (VM e2-small + Cloud SQL db-f1-micro PostgreSQL)

Margen de Beneficio Estimado: 90%

Desglose de Costos Detallado

1. Estimación de Uso de LLM y Costos

Se estima un uso mensual de ~3 millones de tokens, utilizando principalmente gpt-4o-mini por su excelente relación costo-rendimiento. Esta estimación considera un promedio de 230 informes generados al mes (una mezcla de usuarios del plan gratuito y de pago), con cada informe procesando aproximadamente 12,500 tokens (entrada y salida).

Aunque el costo directo de gpt-4o-mini para este volumen sería inferior a $1, se ha asignado un presupuesto de $15/mes para las APIs de LLM. Este buffer permite:

Un margen de error en la estimación de tokens.
El uso ocasional de modelos más potentes como gpt-4o para tareas de síntesis críticas en planes premium.
Posibles iteraciones o prompts más complejos que requieran más tokens.

2. Costos de Infraestructura Cloud

Para una micro-startup, se recomienda una configuración lean en un proveedor de nube como Google Cloud Platform (GCP) para mantener los costos bajos:

Máquina Virtual (VM) para la aplicación Spring Boot: Una instancia e2-small ($12-15/mes) es suficiente para el MVP, manejando la API y orquestando los agentes.
Base de Datos PostgreSQL: Una instancia Cloud SQL db-f1-micro ($10-15/mes) proporciona una base de datos gestionada y escalable con un costo inicial bajo.

Costo total estimado para infraestructura cloud: $35/mes.

3. Otros Costos

APIs Externas: No se identifican costos significativos adicionales para APIs externas más allá de OpenAI en el MVP. La extracción web se realizará con Jsoup, sin depender de APIs de búsqueda de pago.
CDN/Monitoring: No se consideran costos adicionales para CDN en el MVP. El monitoreo básico de la nube está incluido o es de bajo costo.

Estrategias de Optimización FinOps

Para mantener este alto margen de beneficio y escalar de manera eficiente, CogniScout debe implementar las siguientes estrategias FinOps:

Caché de Respuestas LLM y Contenido Web: Implementar un sistema de caché para almacenar resultados de LLM y contenido web previamente raspado. Esto reduce las llamadas redundantes a la API del LLM y el tráfico de scraping, disminuyendo significativamente los costos recurrentes.
Optimización Agresiva de Tokens: Antes de enviar contenido al LLM, realizar un pre-procesamiento exhaustivo. Esto incluye resumir grandes bloques de texto, filtrar información irrelevante y utilizar embeddings para enviar solo los fragmentos más relevantes, minimizando la cantidad de tokens de entrada.
Tiering Inteligente de Modelos LLM: Designar %%INLINE44%% como el modelo predeterminado para la mayoría de las operaciones, especialmente en el plan gratuito y Pro. Reservar el uso de %%INLINE45%% (más caro) estrictamente para las funcionalidades de 'investigación profunda' o 'insights avanzados' del plan Business, donde el valor añadido justifica el costo.
Exploración de Serverless para Workers: Migrar los agentes de investigación asíncronos a un modelo serverless (ej., AWS Lambda o GCP Cloud Functions). Esto permite pagar solo por el tiempo de ejecución real de los agentes, eliminando los costos de una VM dedicada que podría estar ociosa.
Right-Sizing Continuo de la Infraestructura: Monitorizar el uso de CPU, memoria y E/S de la base de datos y la VM. Ajustar el tamaño de las instancias a la demanda real, utilizando instancias burstables como %%INLINE46%% o %%INLINE47%% que son ideales para cargas de trabajo variables de startups.
Scraping Eficiente: Implementar una lógica de scraping que minimice el tráfico de red. Esto incluye respetar robots.txt, evitar la descarga de activos innecesarios (imágenes, CSS) y priorizar la extracción de texto relevante sobre la descarga completa de páginas, reduciendo costos de transferencia de datos y procesamiento.
Batch Processing: Para tareas de investigación que no requieren inmediatez, considerar el procesamiento por lotes durante horas de menor actividad. Esto puede optimizar el uso de recursos y potencialmente aprovechar tarifas de cómputo más bajas si el proveedor de la nube las ofrece.

Al aplicar estas prácticas FinOps, CogniScout puede asegurar una base operativa de bajo costo y una alta rentabilidad, permitiendo una escalabilidad sostenible a medida que crece su base de usuarios.

MVP FEATURES

01Creación de Agentes de Investigación: El usuario define un tema de investigación a través de una simple consulta en lenguaje natural.
02Búsqueda y Extracción Web Autónoma: El agente realiza búsquedas en la web, sigue enlaces relevantes y extrae contenido textual de las páginas clave.
03Síntesis y Generación de Informes: Utiliza un LLM para analizar el contenido recopilado, identificar insights clave y generar un informe resumido con citas y enlaces a las fuentes originales.
04Dashboard de Proyectos: Una interfaz de usuario para iniciar nuevas investigaciones, monitorear el progreso de los agentes activos y acceder a los informes históricos.

“Transforma horas de investigación manual en minutos de insights accionables con la IA de CogniScout.”

Revisad el MVP, especialmente las validaciones de entrada, y preparemos el pitch para la ronda Pre-Seed.

FINANCIALS

Profit Margin0%

Shark Score0

IP Potential0

Run Cost$0.5600

MONETIZATION

SaaS

RISK ASSESSMENT

Riesgos Técnicos: 1. **Calidad del LLM:** La calidad del informe final depende 100% del modelo de lenguaje subyacente. La degradación del modelo o el aumento de costes de la API son riesgos directos. Mitigación: Arquitectura agnóstica al modelo para poder cambiar de proveedor (GPT, Claude, Gemini). 2. **Bloqueo de Scraping:** La extracción de datos web es frágil y susceptible a medidas anti-bot (ej. Cloudflare). Mitigación: Utilizar servicios de proxy rotativos y una infraestructura de scraping resiliente. Riesgos de Negocio: 1. **Competencia Intensa:** Gigantes como Microsoft (Copilot) y startups bien financiadas (Perplexity) pueden incorporar características similares, comoditizando el mercado. 2. **Diferenciación Sostenible:** El foso competitivo debe construirse sobre la experiencia de usuario y la integración en flujos de trabajo específicos, ya que la tecnología base (LLMs, scraping) es accesible.…

FINANCIAL_REPORT.md

⚡CFOAgent·gemini-2.5-ultra

Unit Economics & Profitability

Financial Report: AI Multi-Model Pipeline for Startup Generation Executive Summary Este informe evalúa la viabilidad financiera y los costos operativos de la pi…

⚡IPGuardAgent·gemini-2.5-flash

IP Strategy & Patent Analysis

IP ACQUISITION OPPORTUNITY

Our analysis identifies CogniScout as a candidate for IP-based acquisition. Score: 75/100

SHADOW CTO

Expert technical review. A senior engineer will audit your implementation and provide actionable recommendations within 48h.

# Context: CogniScout [cogniscout-research-agent]
# Spring Boot 4.x + Spring AI
# Powered by Forge-AI protocol

SOURCE LINKS

→YCombinator AI Startups

Related Startups

CertiCopy AI

CertiCopy AI es la solución de IA que genera descripciones de producto atractivas y conformes para equipos de marketing en industrias reguladas. Resolvemos el costoso problema del incumplimiento normativo, acelerando lanzamientos y mitigando riesgos legales, con un robusto Health Score del 87% y un impresionante Profit Margin del 84%.

No detectada·2026-04-27

CertifyContent AI

CertifyContent AI es un copiloto de IA que transforma la creación de descripciones de producto para industrias reguladas, garantizando cumplimiento y atractivo comercial. Con un Health Score del 87% y un Profit Margin del 89%, minimizamos riesgos legales y aceleramos el time-to-market para equipos de marketing y cumplimiento.

No detectada·2026-04-29

Redact AI

Redact AI ofrece un microservicio API-first para que CTOs y Jefes de Ingeniería implementen el 'derecho al olvido' en sus modelos de IA, eliminando datos de usuario de forma segura. Con un Health Score del 84% y un margen de beneficio del 94%, garantizamos cumplimiento normativo, reducimos costes operativos y aceleramos la innovación sin reentrenamientos completos.

No detectada·2026-04-14