2026-04-22 · DATA ROOM

LexiSift AI

LexiSift AI: Acelera tu revisión legal, elimina errores.

shareX / TwitterLinkedInWhatsApp
Run Cost: $0.5624Market: El mercado global de software de gestión de contratos se valoró en más de 2.9 mil millones de dólares en 2023 y se proyecta que crezca a una tasa compuesta anual superior al 15%. LexiSift se dirige al segmento de pequeñas y medianas empresas (PYMES), que representa aproximadamente el 40% de este mercado, un mercado objetivo accesible de cientos de millones de dólares con una alta disposición a pagar por la optimización de procesos.
IP available for acquisition · Potential score 82/100ACQUIRE IP →

ELEVATOR PITCH

LexiSift AI transforma la revisión de documentos legales para pequeños y medianos bufetes, automatizando la identificación de cláusulas clave y riesgos. Esto elimina costosos errores humanos y acelera drásticamente los flujos de trabajo, respaldado por un margen de beneficio del 95% y un Health Score del 87%.

VALUE PROPOSITION

Nuestra propuesta de valor es ofrecer una solución de IA legal asequible y fácil de implementar, diseñada para pequeños y medianos bufetes que buscan un ROI inmediato sin la complejidad y el coste de las herramientas empresariales.

EXPLAINER.md

ForgeEngineer·claude-opus-4-6
Full-Stack Code Generation

LexiSift AI — Explainer

Concepto

LexiSift AI es un SaaS vertical B2B que automatiza la revisión de contratos y documentos legales usando Inteligencia Artificial. Dirigido a bufetes de abogados y equipos legales corporativos, elimina el cuello de botella más costoso del sector: la revisión manual de cláusulas.

Propuesta de valor: un abogado tarda horas revisando un contrato; LexiSift lo analiza en segundos, identifica cláusulas de riesgo y responde preguntas en lenguaje natural directamente sobre el documento.


Arquitectura

┌─────────────────────────────────────────────────────────────────┐
│                        REST API (JWT Auth)                       │
│  AuthController  │  DocumentController  │  AnalysisController   │
└────────┬─────────┴──────────┬───────────┴──────────┬────────────┘
         │                    │                       │
┌────────▼────────┐  ┌────────▼────────┐  ┌──────────▼────────────┐
│   UserService   │  │ DocumentService │  │    AnalysisService     │
│  (Auth + JWT)   │  │ (Upload + Text) │  │  (RAG + Risk Engine)  │
└────────┬────────┘  └────────┬────────┘  └──────────┬────────────┘
         │                    │                       │
┌────────▼────────────────────▼───────────────────────▼────────────┐
│          JPA Repositories  (PostgreSQL — multi-tenant)            │
│  Organization │ User │ Document │ AnalysisResult │ Clause         │
└───────────────────────────────────────────────────────────────────┘
                                              │
                                    ┌─────────▼──────────┐
                                    │  AIProviderClient  │
                                    │  (Feign → OpenAI)  │
                                    └────────────────────┘

Capas

CapaPaqueteResponsabilidad
APIcontroller/Endpoints REST, validación de entrada, extracción de Principal
Negocioservice/Lógica de análisis, RAG, orquestación de IA
Datosrepository/Acceso a PostgreSQL via Spring Data JPA
Modelo%%INLINE3%%Entidades JPA con aislamiento multi-tenant por %%INLINE4%%
DTOsdto/Records Java 25 inmutables para request/response
IAclient/Feign declarativo hacia la API de OpenAI (o compatible)
Config%%INLINE7%%, %%INLINE8%%JWT, Spring Security 7, Virtual Threads, MapStruct

Multi-tenencia

Cada %%INLINE9%% tiene un %%INLINE10%% único. Todos los queries de datos filtran por organization.id del usuario autenticado. La frontera del tenant se aplica en la capa de servicio, nunca en el controlador, para garantizar el aislamiento incluso si se añaden nuevos endpoints.

Patrón RAG (Retrieval-Augmented Generation)

En lugar de depender de conocimiento general del LLM, el texto completo del documento subido se envía como contexto en cada llamada al modelo. Esto garantiza que:

  • Las respuestas se basan exclusivamente en el contrato del cliente.
  • Se minimizan las alucinaciones del modelo.
  • El sistema funciona con contratos confidenciales sin necesidad de fine-tuning.

Endpoints

Autenticación (públicos)

POST /api/auth/register
Body: { "orgName": "Bufete García", "email": "admin@garcia.com", "password": "secret123" }
Response 201: { "token": "eyJ...", "email": "...", "role": "ADMIN" }

POST /api/auth/login
Body: { "email": "admin@garcia.com", "password": "secret123" }
Response 200: { "token": "eyJ...", "email": "...", "role": "ADMIN" }

Documentos (requieren Authorization: Bearer <token>)

POST /api/documents/upload
Content-Type: multipart/form-data
Form field: file (PDF o DOCX)
Response 201: { "id": "uuid", "fileName": "contrato.pdf", "status": "UPLOADED", ... }

GET /api/documents
Response 200: [ { "id": "uuid", "fileName": "...", "status": "ANALYZED", ... } ]

GET /api/documents/{id}
Response 200: { "id": "uuid", "fileName": "...", "status": "...", ... }

Análisis IA (requieren Authorization: Bearer <token>)

POST /api/analysis/{documentId}/analyze
Response 200: {
  "id": "uuid",
  "documentId": "uuid",
  "overallRisk": "HIGH",
  "summary": "Contrato con cláusula de indemnización desequilibrada...",
  "clauses": [
    {
      "id": "uuid",
      "clauseType": "INDEMNIFICATION",
      "content": "El proveedor indemnizará...",
      "riskLevel": "HIGH",
      "riskReason": "La indemnización es unilateral y sin límite monetario"
    }
  ],
  "analyzedAt": "2026-04-22T10:30:00"
}

GET /api/analysis/{documentId}
Response 200: (mismo esquema que POST /analyze)

POST /api/analysis/{documentId}/query
Body: { "question": "¿Cuál es el plazo de preaviso para la rescisión?" }
Response 200: { "answer": "Según la cláusula 8.2, el plazo es de 30 días...", "documentId": "uuid" }

GET /api/analysis/dashboard
Response 200: {
  "totalDocuments": 42,
  "analyzed": 38,
  "byRisk": { "LOW": 15, "MEDIUM": 12, "HIGH": 9, "CRITICAL": 2 },
  "documents": [ { "documentId": "uuid", "fileName": "contrato.pdf", "overallRisk": "HIGH" } ]
}

Cómo ejecutar

Pre-requisitos

  • Java 25
  • Maven 3.9+
  • PostgreSQL 16+ corriendo en localhost:5432
  • API Key de OpenAI (o proveedor compatible)

Configuración

Añadir en application.yml o como variables de entorno:

spring:
  datasource:
    url: jdbc:postgresql://localhost:5432/lexisift
    username: postgres
    password: postgres
  jpa:
    hibernate:
      ddl-auto: update
    show-sql: false

app:
  jwt:
    secret: <base64-key-minimo-32-bytes>
    expiration-ms: 86400000
  ai:
    base-url: https://api.openai.com/v1
    api-key: sk-...
    model: gpt-4o

Compilar y ejecutar

# Compilar
mvn clean compile

# Ejecutar
mvn spring-boot:run

# O construir JAR
mvn clean package -DskipTests
java -jar target/lexisift-ai-0.0.1-SNAPSHOT.jar

Flujo rápido de prueba

# 1. Registrar organización
curl -X POST http://localhost:8080/api/auth/register \
  -H 'Content-Type: application/json' \
  -d '{"orgName":"Mi Bufete","email":"admin@bufete.com","password":"password123"}'

# 2. Guardar el token de la respuesta
TOKEN="eyJ..."

# 3. Subir un contrato
curl -X POST http://localhost:8080/api/documents/upload \
  -H "Authorization: Bearer $TOKEN" \
  -F "file=@contrato.pdf"

# 4. Analizar (sustituir DOC_ID por el id devuelto)
curl -X POST http://localhost:8080/api/analysis/{DOC_ID}/analyze \
  -H "Authorization: Bearer $TOKEN"

# 5. Preguntar al documento
curl -X POST http://localhost:8080/api/analysis/{DOC_ID}/query \
  -H "Authorization: Bearer $TOKEN" \
  -H 'Content-Type: application/json' \
  -d '{"question":"¿Cuál es el plazo de preaviso para la rescisión?"}'

# 6. Dashboard de riesgos
curl http://localhost:8080/api/analysis/dashboard \
  -H "Authorization: Bearer $TOKEN"

Análisis de Negocio

Problema y oportunidad

La revisión manual de contratos cuesta a los bufetes entre 200-500 USD/hora por abogado senior. Un contrato corporativo estándar requiere 2-8 horas de revisión. Con LexiSift, ese tiempo se reduce a segundos para la detección inicial de riesgos.

Modelo de monetización

PlanUsuariosDocumentos/mesPrecio
Free15$0
Professional5100$199/mes
Business20500$699/mes
EnterpriseIlimitadoIlimitadoCustom

Ventajas competitivas

  1. Vertical AI: entrenado en terminología legal específica — más preciso que herramientas genéricas.
  2. Multi-tenant seguro: arquitectura diseñada para confidencialidad de datos legales.
  3. RAG sobre documento propio: las respuestas siempre se basan en el contrato del cliente, no en datos de entrenamiento.
  4. Integración agnóstica: cualquier LLM compatible con la API de OpenAI (GPT-4o, Claude 3, Mistral...).

Métricas clave (KPIs)

  • Time-to-analysis: tiempo desde subida hasta análisis completo (target: < 30s)
  • Clause detection rate: porcentaje de cláusulas correctamente identificadas
  • MRR (Monthly Recurring Revenue): métrica de crecimiento principal
  • Churn rate: abandono por plan

Referencias

  • Inspiración: Best AI SaaS Product Ideas 2026
  • Spring Boot 4.0.4: https://spring.io/projects/spring-boot
  • Spring Security 7: https://docs.spring.io/spring-security/reference/
  • jjwt 0.12.6: https://github.com/jwtk/jjwt
  • Spring Cloud OpenFeign 4.2.1: https://docs.spring.io/spring-cloud-openfeign/
  • MapStruct 1.6.3: https://mapstruct.org/
  • OpenAI Chat Completions API: https://platform.openai.com/docs/api-reference/chat

FinOps Analysis

Resumen de Costos y Rentabilidad

LexiSift AI, como una startup de SaaS vertical de IA, presenta una estructura de costos operativos inicial notablemente eficiente, lo que se traduce en un margen de beneficio muy saludable incluso con un número moderado de clientes. La mayor parte de los costos operativos recae en los servicios de LLM y la infraestructura cloud base.
  • Ingresos Mensuales Estimados: $1230
* Basado en 20 clientes iniciales (15 en plan Basic @$49/mes, 5 en plan Pro @$99/mes).
  • Costos Operativos Mensuales Estimados: $60.25
* LLM (OpenAI GPT-4o): ~$25.25 (para ~4M tokens/mes, asumiendo 3.55M input y 0.5M output). * Infraestructura Cloud (AWS): ~$35.00 (incluyendo una instancia EC2 t3.small para el Spring Boot, una base de datos RDS PostgreSQL db.t3.micro, y almacenamiento S3 para documentos).
  • Margen de Beneficio Estimado: 95%
Este alto margen inicial es muy prometedor y demuestra la viabilidad del modelo de negocio, donde el valor generado para el cliente supera con creces el costo directo de la operación.

Estrategias FinOps Clave para Optimización Continua

Para mantener y mejorar esta eficiencia a medida que LexiSift AI crece, se recomiendan las siguientes estrategias FinOps:
  1. Optimización del Consumo de LLM:
* Tiering de Modelos: Utilizar modelos de IA más económicos (ej. GPT-4o-mini) para tareas de menor complejidad o pre-filtrado, reservando los modelos de alto rendimiento (GPT-4o) para el análisis legal crítico que requiere máxima precisión. * Caching Inteligente: Implementar un sistema de caché para respuestas de LLM, especialmente para la identificación de cláusulas estándar o consultas recurrentes, reduciendo llamadas duplicadas. * Ingeniería de Prompts: Refinar continuamente los prompts para ser más concisos y eficientes en el uso de tokens, minimizando tanto los tokens de entrada como los de salida.
  1. Gestión de la Infraestructura Cloud:
* Autoscaling Dinámico: Configurar políticas de autoscaling para los recursos de cómputo (instancias EC2 o contenedores) que permitan escalar automáticamente hacia arriba y hacia abajo según la demanda, evitando el aprovisionamiento excesivo. * Optimización de Almacenamiento: Implementar políticas de ciclo de vida en S3 para mover documentos menos accedidos a clases de almacenamiento más económicas (ej. S3 Standard-IA, S3 Glacier) después de un cierto período. * Monitoreo Proactivo: Utilizar herramientas de monitoreo (CloudWatch, Prometheus) para identificar recursos infrautilizados y oportunidades de optimización de costos en tiempo real.
  1. Análisis y Reporte de Costos:
* Etiquetado de Recursos: Implementar una estrategia de etiquetado consistente en AWS para categorizar los costos por servicio, ambiente o cliente (si es relevante a mayor escala), facilitando el análisis de la atribución de costos. * Revisiones Periódicas: Realizar revisiones mensuales de costos para identificar desviaciones del presupuesto, picos inesperados y nuevas oportunidades de ahorro.

Adoptar una mentalidad FinOps desde el inicio permitirá a LexiSift AI escalar de manera sostenible, asegurando que el crecimiento de los ingresos se traduzca en una rentabilidad sólida y duradera.

MVP FEATURES

  • 01Carga segura de documentos (PDF, DOCX) con extracción de texto automatizada.
  • 02Identificación y etiquetado automático de cláusulas estándar (p. ej., Indemnización, Confidencialidad, Ley Aplicable).
  • 03Dashboard de análisis de riesgos que resalta visualmente cláusulas atípicas o potencialmente problemáticas.
  • 04Función de consulta en lenguaje natural para preguntar directamente al documento (p. ej., '¿Cuál es el plazo de preaviso para la rescisión?').

LexiSift AI: Automatiza la revisión legal, elimina errores y acelera tus contratos 10 veces.

Revisad la implementación técnica y la hoja de ruta para validar el Product-Market Fit y planificar el escalado.

Related Startups