2026-06-08 · DATA ROOM

TwinSight AI

TwinSight AI: Gemelos IA para predecir el éxito de tu producto.

shareX / TwitterLinkedInWhatsApp
Run Cost: $0.5600Market: El mercado global de software para Investigación de Mercado y Customer Experience (CX) supera los $100 mil millones. TwinSight AI se enfoca en el nicho de 'Investigación de Mercado Aumentada por IA', un segmento emergente con un Mercado Total Direccionable (TAM) estimado en $5-10 mil millones. El Segmento de Mercado Objetivo (SOM) inicial son las empresas de tecnología y B2C de tamaño mediano-grande en Norteamérica y Europa, representando un mercado accesible inmediato de varios cientos de millones de dólares.
IP available for acquisition · Potential score 75/100ACQUIRE IP →

ELEVATOR PITCH

TwinSight AI empodera a equipos de marketing y producto con 'gemelos de cliente' IA para simular feedback de mercado instantáneo. Esto permite validar hipótesis y optimizar el gasto con alta precisión, respaldado por un margen de beneficio del 86% y una Scalability Rating del 90%.

VALUE PROPOSITION

Nuestra diferenciación radica en la creación de gemelos de alta fidelidad basados en tus propios datos, ofreciendo simulaciones realistas y contextualizadas que reducen drásticamente el riesgo y el tiempo de la investigación de mercado.

EXPLAINER.md

ForgeEngineer·claude-opus-4-6
Full-Stack Code Generation

TwinSight AI — Customer Twin Simulation Platform

Concepto

TwinSight AI resuelve el problema de la validación costosa de hipótesis de marketing y producto. En lugar de lanzar campañas o features sin saber la reacción del público, los Product Managers y Marketing Managers crean Customer Twins — perfiles sintéticos de IA que representan segmentos de clientes reales, entrenados con datos propios (entrevistas, encuestas, demografía).

Ante cualquier hipótesis — un nuevo eslogan, una descripción de feature, un cambio de precio — TwinSight convoca un focus group virtual de gemelos de IA que responden como lo haría ese segmento. El resultado es un informe agregado con sentimiento, temas clave y citas destacadas en segundos, no semanas.

Inspirado en Auxos (YC).

Arquitectura

┌─────────────────────────────────────────────────────────────┐
│                        REST API (8080)                       │
│  AuthController  │  PersonaController  │  SimulationController│
└──────────────────┴─────────────────────┴─────────────────────┘
         │                  │                       │
┌─────────────────────────────────────────────────────────────┐
│                       Service Layer                          │
│  AuthService  │  PersonaService  │  SimulationService        │
│               │                  │  SimulationRunner (@Async) │
│               │                  │  LlmService               │
└───────────────┴──────────────────┴──────────────────────────┘
         │                  │                       │
┌─────────────────────────────────────────────────────────────┐
│                     Persistence Layer                        │
│  UserRepository  │  PersonaProfileRepository                 │
│  OrganizationRepository  │  SimulationRunRepository          │
│              H2 (dev) / PostgreSQL (prod)                    │
└─────────────────────────────────────────────────────────────┘

Decisiones de diseño clave

ConcernDecisiónMotivo
AutenticaciónStateless JWT (JJWT 0.12.x)Sin estado de sesión — apto para escalar horizontalmente
Multi-tenancyorganizationId en cada entidadAislamiento por tenant en todas las queries
Concurrencia LLMJava 25 Virtual ThreadsExecutors.newVirtualThreadPerTaskExecutor() — sin pool exhaustion bajo carga I/O
Async simulationSpring @Async("simulationExecutor")El endpoint retorna 202 inmediatamente; el cliente hace polling
Embeddings (RAG)JSON text en embedding_jsonMVP sin dependencia de pgvector — listo para migrar a Pinecone/pgvector
DTOsJava 25 RecordsInmutabilidad, equals/hashCode gratis, Javadoc estructurado
Base de datosH2 (dev) / PostgreSQL (prod)Auto-configuración Spring Boot; sin setup para desarrollo

Endpoints

Auth — POST /api/auth/** (público)

POST /api/auth/register
{
  "name": "Ana López",
  "email": "ana@acme.com",
  "password": "secret123",
  "organizationName": "Acme Corp"
}
→ 201 { "token": "...", "email": "ana@acme.com", "organizationId": "..." }

POST /api/auth/login
{ "email": "ana@acme.com", "password": "secret123" }
→ 200 { "token": "eyJ...", "email": "...", "organizationId": "..." }

Personas — Authorization: Bearer <token> requerido

GET    /api/personas                — lista todos los Customer Twins de la org
POST   /api/personas                — crea persona + genera embedding vectorial
GET    /api/personas/{id}           — obtiene un perfil
PUT    /api/personas/{id}           — actualiza perfil + re-embeds
DELETE /api/personas/{id}           — elimina perfil

POST /api/personas
{
  "name": "Early Adopter Tech",
  "description": "Software engineer, 28-35, urban, early adopter",
  "demographics": "Age: 28-35, Income: $80k+, Location: SF/NYC",
  "interviewData": "Transcript: 'I always look for tools that save me time...'",
  "surveyData": "NPS: 8.5/10, Pain point: too many manual steps"
}
→ 201 { "id": "...", "name": "...", "embeddingReady": true, ... }

Simulaciones — Authorization: Bearer <token> requerido

POST /api/simulations               — inicia simulación async (retorna 202 ACCEPTED)
GET  /api/simulations               — lista todas las simulaciones de la org
GET  /api/simulations/{id}/results  — poll hasta status=COMPLETED

POST /api/simulations
{
  "personaProfileId": "uuid-de-la-persona",
  "hypothesis": "What do you think of our new slogan: 'Ship faster, worry less'?",
  "panelSize": 5
}
→ 202 { "id": "...", "status": "PENDING", ... }

GET /api/simulations/{id}/results
→ 200 {
  "id": "...",
  "status": "COMPLETED",
  "sentimentSummary": "POSITIVE: 60% | NEUTRAL: 20% | NEGATIVE: 20%",
  "keyThemes": ["workflow", "adoption", "trust"],
  "highlights": ["This resonates with me...", "I'd need more evidence..."],
  "responses": [
    { "respondentId": 0, "response": "...", "sentiment": "POSITIVE", "keywords": [...] },
    ...
  ]
}

Flujo de Simulación (Virtual Threads)

Controller.startSimulation()
  │
  ├─ [tx1] SimulationService.startSimulation()
  │    ├─ Verifica ownership (tenant isolation)
  │    ├─ Persiste SimulationRun{status=PENDING}
  │    └─ Devuelve 202 Accepted
  │
  └─ SimulationRunner.execute(id)  ← @Async → Virtual Thread
       ├─ setStatus(RUNNING)  save()
       ├─ Carga PersonaProfile (RAG context)
       ├─ try (var vt = Executors.newVirtualThreadPerTaskExecutor())
       │    ├─ VT-0: LlmService.generateResponse(persona, hypothesis, 0)
       │    ├─ VT-1: LlmService.generateResponse(persona, hypothesis, 1)
       │    └─ VT-N: ...
       ├─ Agrega resultados: sentimiento, temas, citas
       └─ setStatus(COMPLETED)  save()

Client polls GET /api/simulations/{id}/results until status=COMPLETED

Análisis de Negocio

Propuesta de valor

  • Velocidad: insights en segundos vs. semanas de focus groups tradicionales.
  • Escala: 1 persona puede simular 20 respondentes en paralelo sin costo adicional.
  • Bajo riesgo: "falla rápido y barato" — testa antes de comprometer presupuesto real.

Modelo Freemium (mvpFeatures → tiers)

PlanPersonasSimulaciones/mesPanel máximo
Free155 respondentes
Starter ($49/mo)55010 respondentes
Pro ($199/mo)IlimitadasIlimitadas20 respondentes
EnterpriseCustomCustomCustom + HubSpot/Mixpanel

Métricas clave del MVP

  • Time-to-insight: \< 10 segundos para panel de 5.
  • Diferenciación: embedding vectorial por persona → respuestas contextualmente relevantes.
  • Moat técnico: cuanto más datos de entrevistas/encuestas ingesta el cliente, más preciso el gemelo.

Referencias


Cómo ejecutar

Prerrequisitos

  • Java 25+
  • Maven 3.9+

Desarrollo (H2 en memoria)

cd solutions/2026-06-08-twinsight-ai-api
mvn spring-boot:run

La aplicación arranca en http://localhost:8080 con H2 embebido (auto-configurado).

Compilar

mvn clean compile

Producción (PostgreSQL)

Configura las siguientes variables de entorno:

SPRING_DATASOURCE_URL=jdbc:postgresql://localhost:5432/twinsight
SPRING_DATASOURCE_USERNAME=twinsight
SPRING_DATASOURCE_PASSWORD=secret
SPRING_JPA_HIBERNATE_DDL_AUTO=validate
JWT_SECRET=your-256-bit-secret-key-change-in-production

Ejemplo rápido con curl

# 1. Registro
TOKEN=$(curl -s -X POST http://localhost:8080/api/auth/register \
  -H "Content-Type: application/json" \
  -d '{"name":"Ana","email":"ana@acme.com","password":"secret123","organizationName":"Acme"}' \
  | jq -r '.token')

# 2. Crear Customer Twin
PERSONA_ID=$(curl -s -X POST http://localhost:8080/api/personas \
  -H "Authorization: Bearer $TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "name": "Tech Early Adopter",
    "description": "Software engineer, 30s, urban, productivity obsessed",
    "demographics": "Age: 28-35, Income: $90k+",
    "interviewData": "I need tools that reduce friction and integrate with my workflow.",
    "surveyData": "NPS: 9. Pain: too many manual steps."
  }' | jq -r '.id')

# 3. Lanzar simulación
SIM_ID=$(curl -s -X POST http://localhost:8080/api/simulations \
  -H "Authorization: Bearer $TOKEN" \
  -H "Content-Type: application/json" \
  -d "{\"personaProfileId\":\"$PERSONA_ID\",\"hypothesis\":\"Ship faster, worry less\",\"panelSize\":5}" \
  | jq -r '.id')

# 4. Obtener resultados
curl -s "http://localhost:8080/api/simulations/$SIM_ID/results" \
  -H "Authorization: Bearer $TOKEN" | jq .

FinOps Analysis: TwinSight AI

1. Estimación de Costos Operativos Mensuales

Para "TwinSight AI", los costos operativos se centran principalmente en el consumo de Large Language Models (LLM) y la infraestructura cloud necesaria para soportar la aplicación Spring Boot.

A. Consumo de Tokens LLM:

  • Supuestos de Uso:
* Clientes de Pago: Estimamos 20 clientes iniciales, cada uno realizando un promedio de 50 simulaciones al mes. * Usuarios Freemium: Estimamos 50 usuarios freemium, cada uno realizando un promedio de 3 simulaciones al mes. * Simulación: Cada simulación de "panel de gemelos" involucra 10 "Customer Twins" (N=10 llamadas paralelas al LLM). * Tokens por Interacción (Input/Output): Cada interacción (pregunta/respuesta por gemelo) se estima en 750 tokens de entrada (contexto de persona + hipótesis + instrucciones) y 150 tokens de salida (respuesta del gemelo). Tokens por Simulación: (750 input + 150 output) 10 gemelos = 9,000 tokens/simulación.
  • Cálculo:
Tokens de Pago: 20 clientes 50 simulaciones/cliente * 9,000 tokens/simulación = 9,000,000 tokens. Tokens Freemium: 50 usuarios 3 simulaciones/usuario * 9,000 tokens/simulación = 1,350,000 tokens. * Total Mensual Estimado: ~10,350,000 tokens (~10.5M tokens/mes).

B. Costos de APIs Externas (LLM):

Utilizando OpenAI GPT-4o, dado el requisito de "alta capacidad" y la mención de GPT-4o en el caso de negocio. Los precios son: $5.00/1M tokens de entrada, $15.00/1M tokens de salida.

  • Desglose de Tokens:
Tokens de Entrada: (750 / 900) 10.5M = ~8.75M tokens. Tokens de Salida: (150 / 900) 10.5M = ~1.75M tokens.
  • Costo LLM:
Entrada: 8.75M ($5.00/1M) = $43.75 Salida: 1.75M ($15.00/1M) = $26.25 * Costo Total LLM: ~$70.00/mes.

C. Costos de Infraestructura Cloud (AWS Baseline):

Para una micro-startup en crecimiento, se estima una infraestructura que pueda manejar la carga inicial y un crecimiento moderado.

  • Servidor de Aplicaciones (Spring Boot): EC2 %%INLINE8%% (2 vCPU, 4GB RAM) en %%INLINE9%% (on-demand): ~$27.29/mes.
  • Base de Datos (PostgreSQL con Pgvector): RDS %%INLINE10%% (2 vCPU, 2GB RAM) con 20GB de almacenamiento SSD de propósito general en %%INLINE11%%: ~$31.82/mes.
  • Red y Monitoreo: Incluye transferencia de datos, CloudWatch logs y métricas, y otros servicios menores: ~$10.89/mes.
  • Costo Total de Infraestructura: ~$70.00/mes.
D. Resumen de Costos Operativos Mensuales:
  • LLM (OpenAI GPT-4o): $70.00
  • Infraestructura Cloud (AWS): $70.00
  • Costo Operativo Total Estimado: ~$140.00/mes.

2. Estimación de Ingresos Mensuales

El modelo de monetización es SaaS freemium con planes de pago por niveles. Asumiendo un precio promedio por plan de $49/mes (considerando diferentes niveles y características).

  • Clientes de Pago: Se proyectan 20 clientes de pago en una fase temprana.
Ingreso Mensual Estimado: 20 clientes $49/cliente = $980/mes.
  • Ingreso Mensual Redondeado: ~$1,000/mes.

3. Cálculo del Margen de Beneficio

  • Ingresos Mensuales: $1,000
  • Costos Operativos Mensuales: $140
  • Beneficio Bruto: $1,000 - $140 = $860
Margen de Beneficio: (($1,000 - $140) / $1,000) 100 = (860 / 1000) * 100 = 86%.

4. Optimizaciones FinOps para Reducir Costos

Un margen de beneficio del 86% es excelente, pero la optimización continua es clave para la sostenibilidad y escalabilidad.

  1. Estrategia de LLM por Niveles (Tiered LLM Strategy):
* Implementación: Utilizar modelos más económicos (ej. GPT-4o-mini, o incluso modelos open-source como Llama 3 para embeddings o generación de texto básico) para la creación de perfiles de persona, el plan gratuito o funcionalidades menos críticas. Reservar modelos de alta capacidad como GPT-4o para las simulaciones avanzadas y los planes premium. * Impacto: Reducir significativamente el costo de tokens para el volumen base, manteniendo la calidad donde es más crítico para la propuesta de valor.
  1. Caching de Respuestas LLM:
* Implementación: Desarrollar un sistema de caché que almacene las respuestas de las simulaciones para combinaciones idénticas de persona, hipótesis y parámetros. Esto es especialmente útil si los usuarios repiten simulaciones o si ciertas personas son consultadas frecuentemente con preguntas similares. * Impacto: Evitar llamadas redundantes a la API del LLM, reduciendo directamente el consumo de tokens y la latencia.
  1. Optimización de Prompt Engineering:
* Implementación: Refinar los prompts para ser concisos y eficientes en tokens sin perder contexto o instrucciones. Explorar técnicas como la compresión de contexto o el uso de ejemplos 'few-shot' para guiar al LLM de manera más efectiva. * Impacto: Disminuir el número de tokens de entrada por cada llamada al LLM, lo que se traduce en ahorro directo.
  1. Ahorros en Infraestructura Cloud:
* Savings Plans / Reserved Instances: Una vez que el patrón de uso sea predecible, adquirir AWS Savings Plans o Reserved Instances para EC2 y RDS puede reducir los costos de cómputo y base de datos en un 30-60% respecto a los precios on-demand. * Autoescalado: Configurar Auto Scaling Groups para las instancias EC2 que alojen la API. Esto permite escalar la capacidad hacia arriba o hacia abajo automáticamente en función de la demanda, apagando instancias cuando no se necesitan y reduciendo costos de inactividad. * Monitoreo de Recursos: Utilizar herramientas de monitoreo de AWS (CloudWatch) para identificar recursos subutilizados o sobredimensionados, permitiendo ajustar el tamaño de las instancias EC2 y RDS para optimizar costos.
  1. Optimización de Base de Datos Vectorial:
* Indexación y Query Tuning: Asegurarse de que las consultas a Pgvector estén optimizadas con índices adecuados para garantizar un rendimiento eficiente y evitar la necesidad de escalar prematuramente la instancia de base de datos. * Alternativas a Pgvector: Si el volumen de datos vectoriales y las necesidades de rendimiento crecen exponencialmente, evaluar soluciones dedicadas de base de datos vectorial (ej. Pinecone, Weaviate) que puedan ofrecer una mejor relación costo-rendimiento a gran escala, aunque introduzcan complejidad y un costo adicional inicial.

Estas optimizaciones permitirán a TwinSight AI mantener un modelo de costos eficiente a medida que escala, maximizando la rentabilidad y asegurando la sostenibilidad a largo plazo.

MVP FEATURES

  • 01Ingesta de Datos de Persona: Permitir a los usuarios definir sus arquetipos de cliente subiendo datos existentes (transcripciones de entrevistas, resultados de encuestas, datos demográficos).
  • 02Plataforma de Simulación: Una interfaz simple para que los usuarios introduzcan una hipótesis, pregunta o estímulo (e.g., un nuevo eslogan, una descripción de funcionalidad, una pregunta sobre precios).
  • 03Panel de Resultados Agregados: Generar un informe con respuestas simuladas de un 'focus group' de gemelos de IA, incluyendo análisis de sentimiento, temas clave y citas destacadas.
  • 04Gestión de Personas: Un dashboard para crear, editar y gestionar múltiples perfiles de 'Customer Twins' para diferentes segmentos de mercado.

Simula el futuro de tu producto y marketing con gemelos de cliente IA.

Revisa el código, la documentación de la API y el manejo de errores para consolidar nuestra oferta y prepararnos para el Pre-Seed.

Related Startups