2026-06-17 · DATA ROOM

LedgerLens AI

LedgerLens AI: Datos Financieros en Decisiones Estratégicas

shareX / TwitterLinkedInWhatsApp
Run Cost: $0.5600Market: El mercado global de IA en Fintech se valora en decenas de miles de millones de dólares (TAM). LedgerLens AI apunta a un segmento específico de análisis de documentos no estructurados para inteligencia financiera, un mercado de varios cientos de millones (SAM). Su mercado objetivo inicial (SOM) son las pequeñas y medianas firmas financieras, que representan un mercado accesible estimado en $50-100 millones anuales.
IP available for acquisition · Potential score 70/100ACQUIRE IP →

ELEVATOR PITCH

LedgerLens AI transforma datos financieros no estructurados en insights estratégicos, automatizando el análisis de documentos para analistas de riesgo y cumplimiento. Esta solución B2B, con un excelente margen de beneficio del 87% y alta calidad de código (Health Score 87%), está diseñada para agilizar la toma de decisiones y reducir errores.

VALUE PROPOSITION

Ofrecemos una alternativa ágil y asequible a las plataformas complejas, democratizando el acceso a la inteligencia de mercado crítica para firmas financieras medianas, sin la complejidad ni el coste de los gigantes.

EXPLAINER.md

ForgeEngineer·claude-opus-4-6
Full-Stack Code Generation

LedgerLens AI — Explainer

Concept

LedgerLens AI is a B2B SaaS fintech NLP platform that eliminates the manual reading burden for financial analysts and compliance officers. Users upload financial documents (SEC filings, earnings reports, press releases) and receive in seconds:

  • Sentiment classification tuned to financial domain lexicon (POSITIVE / NEGATIVE / NEUTRAL + confidence score)
  • Named-entity extraction — companies, executives, key metrics (EBITDA, revenue, EPS), market events (M&A, IPO, dividends)
  • Executive summary generated by an LLM
  • Keyword alerts that fire when monitored terms appear in new documents

Architecture

Client (cURL / Frontend / Dashboard)
        │
        ▼
┌────────────────────────────────────────┐
│  Spring Boot 4.0.4 REST API (Java 25)  │
│                                        │
│  AuthController   /api/v1/auth/**      │
│  DocumentController /api/v1/documents  │
│  AlertController  /api/v1/alerts       │
│           │                            │
│  JwtAuthenticationFilter               │
│  SecurityConfig (stateless JWT)        │
│           │                            │
│  DocumentService  ──► AnalysisService  │
│                             │          │
│                      LlmClient (Feign) │
│                             │          │
│                   OpenAI / GPT-4o API  │
│           │                            │
│  AlertService  (keyword matcher)       │
└────────────────┬───────────────────────┘
                 │
         PostgreSQL DB
   users | financial_documents
   analysis_results | alert_configs

Key Design Decisions

ConcernSolution
Multi-tenancy%%INLINE0%% column on every resource; JWT embeds %%INLINE1%% claim
Async LLM callsThread.ofVirtual() — Java 25 virtual threads, non-blocking
LLM integrationOpenFeign client → OpenAI-compatible chat completions endpoint
SecurityStateless JWT (jjwt 0.12.6), BCrypt passwords, no sessions
Structured LLM outputJSON-schema prompt; fallback to raw summary on parse failure
StyleJava 25 %%INLINE3%%, Records for all DTOs, constructor injection, %%INLINE4%%

Endpoints

Auth (/api/v1/auth) — Public

MethodPathDescription
%%INLINE6%%%%INLINE7%%Create user + tenant, returns JWT
%%INLINE8%%%%INLINE9%%Authenticate, returns JWT
Register body:
{
  "email": "analyst@hedgefund.com",
  "password": "securePass123",
  "tenantId": "acme-capital"
}

Login body:

{ "email": "analyst@hedgefund.com", "password": "securePass123" }

Response:

{ "token": "eyJ...", "email": "analyst@hedgefund.com", "role": "USER", "tenantId": "acme-capital" }


Documents (/api/v1/documents) — JWT Required

MethodPathDescription
%%INLINE11%%%%INLINE12%%Upload PDF or TXT file (multipart)
%%INLINE13%%%%INLINE14%%Ingest from public URL (SEC EDGAR etc.)
%%INLINE15%%%%INLINE16%%List tenant documents
%%INLINE17%%%%INLINE18%%Get NLP result for a document
Upload file:
curl -X POST http://localhost:8080/api/v1/documents/upload \
  -H "Authorization: Bearer <token>" \
  -F "file=@earnings-q4.txt"

Ingest URL:

curl -X POST http://localhost:8080/api/v1/documents/ingest-url \
  -H "Authorization: Bearer <token>" \
  -H "Content-Type: application/json" \
  -d '{"url": "https://www.sec.gov/Archives/edgar/data/320193/0001193125-24-012345.txt"}'

Analysis response:

{
  "id": "uuid",
  "documentId": "uuid",
  "filename": "earnings-q4.txt",
  "sentiment": "POSITIVE",
  "sentimentScore": 0.87,
  "entities": [
    { "type": "COMPANY",  "value": "Apple Inc.",  "context": "Apple Inc. reported record revenue..." },
    { "type": "METRIC",   "value": "EBITDA",      "context": "EBITDA grew 12% year-over-year..." },
    { "type": "EVENT",    "value": "Q4 Earnings", "context": "Q4 Earnings beat analyst estimates..." }
  ],
  "summary": "Apple reported record Q4 revenue of $119B, beating consensus by 4%. EBITDA grew 12% YoY driven by Services segment strength. Management guided Q1 revenue above street estimates.",
  "analyzedAt": "2026-06-17T14:23:00"
}


Alerts (/api/v1/alerts) — JWT Required

MethodPathDescription
%%INLINE20%%%%INLINE21%%Create keyword alert
%%INLINE22%%%%INLINE23%%List tenant alerts
%%INLINE24%%%%INLINE25%%Enable / disable alert
Create alert:
curl -X POST http://localhost:8080/api/v1/alerts \
  -H "Authorization: Bearer <token>" \
  -H "Content-Type: application/json" \
  -d '{"name": "M&A Watch", "keywords": "merger,acquisition,M&A,takeover", "emailRecipient": "compliance@hedgefund.com"}'

Data Model

users
  id UUID PK
  email UNIQUE
  password (BCrypt)
  role
  tenant_id          ← multi-tenant isolation key
  created_at

financial_documents
  id UUID PK
  tenant_id
  filename
  file_type          (PDF | TXT | URL)
  source_url
  raw_text TEXT      ← extracted content
  status             (PENDING | PROCESSING | COMPLETED | FAILED)
  uploaded_by FK → users
  created_at, updated_at

analysis_results
  id UUID PK
  document_id FK → financial_documents
  sentiment          (POSITIVE | NEGATIVE | NEUTRAL)
  sentiment_score    DOUBLE
  entities_json TEXT ← JSON array of {type,value,context}
  summary TEXT
  analyzed_at

alert_configs
  id UUID PK
  tenant_id
  name
  keywords TEXT      ← comma-separated
  email_recipient
  active BOOLEAN
  created_by FK → users
  created_at

Business Analysis

Revenue Model

B2B SaaS tiered by documents/month:
TierDocs/monthPrice/month
Starter100$299
Growth1 000$999
EnterpriseUnlimitedCustom

TAM & Differentiation

  • Target: hedge funds, investment banks, compliance teams
  • Pain: analysts spend 40–60% of time on manual document review
  • Moat: domain-specific prompt engineering + financial NER; switching cost from integrated workflows

Source


How to Run

Prerequisites

  • Java 25
  • Maven 3.9+
  • PostgreSQL 15+ (running locally or via Docker)
  • OpenAI API key (or compatible LLM provider)

1 — Start PostgreSQL

docker run -d --name ledgerlens-pg \
  -e POSTGRES_USER=ledgerlens \
  -e POSTGRES_PASSWORD=ledgerlens \
  -e POSTGRES_DB=ledgerlens \
  -p 5432:5432 postgres:15

2 — Configure environment

Add to application.yml or export as env vars:
spring:
  datasource:
    url: jdbc:postgresql://localhost:5432/ledgerlens
    username: ledgerlens
    password: ledgerlens
  jpa:
    hibernate:
      ddl-auto: update
    show-sql: false

app:
  jwt-secret: "YourSuperSecretKeyAtLeast32CharsLong!!"
  jwt-expiration-ms: 86400000
  llm-api-url: "https://api.openai.com/v1"
  llm-api-key: "sk-..."
  llm-model: "gpt-4o"

3 — Build & Run

cd solutions/2026-06-17-ledger-lens-ai
mvn clean package -DskipTests
java -jar target/ledger-lens-ai-0.0.1-SNAPSHOT.jar

4 — Quick smoke test

# Register
curl -s -X POST http://localhost:8080/api/v1/auth/register \
  -H "Content-Type: application/json" \
  -d '{"email":"demo@test.com","password":"demo1234","tenantId":"demo-corp"}' | jq .

# Upload a document
TOKEN="<token from register>"
echo "Apple reported record Q4 EBITDA beating all analyst estimates. M&A activity expected." > /tmp/test.txt
curl -s -X POST http://localhost:8080/api/v1/documents/upload \
  -H "Authorization: Bearer $TOKEN" \
  -F "file=@/tmp/test.txt" | jq .

# Poll for analysis (wait ~5s for LLM)
DOC_ID="<id from upload>"
curl -s http://localhost:8080/api/v1/documents/$DOC_ID/analysis \
  -H "Authorization: Bearer $TOKEN" | jq .

FinOps Analysis - LedgerLens AI

Resumen de Costos y Rentabilidad

LedgerLens AI, en su fase de Producto Mínimo Viable (MVP), demuestra un modelo de negocio con una alta rentabilidad proyectada, lo cual es excelente para una micro-startup SaaS B2B. Los costos operativos son significativamente bajos en comparación con el potencial de ingresos, principalmente debido a la eficiencia de los modelos de lenguaje grandes (LLM) de bajo costo y una infraestructura cloud inicial optimizada.

  • Ingresos Mensuales Estimados: $500 (basado en 5 clientes a $100/mes cada uno por un nivel básico de 50 documentos/2 usuarios).
  • Costos Operativos Mensuales Estimados: $65
- LLM (OpenAI gpt-4o-mini): $1 (estimación de 1 millón de tokens, 80% entrada, 20% salida. Este costo es notablemente bajo gracias a la agresiva política de precios de OpenAI para su modelo 'mini'). - Infraestructura Cloud (AWS/GCP/Azure): $64 - Compute: $27 (Ej. EC2 t3.medium o equivalente, para ejecutar la aplicación Spring Boot). - Base de Datos: $19 (Ej. RDS PostgreSQL t3.small o equivalente, para almacenar metadatos y resultados). - Almacenamiento/Red/Monitoreo: $18 (Ej. S3 para documentos, costos de red, monitoreo básico).
  • Margen de Beneficio Proyectado: 87%

Desglose Detallado de Costos

La estructura de costos revela que la mayor parte del gasto se concentra en la infraestructura cloud, mientras que los costos de las APIs de LLM son marginales para el volumen de uso estimado en el MVP. Esto subraya la importancia de optimizar la infraestructura desde el inicio.

Oportunidades de Optimización de Costos (FinOps)

Para mantener este alto margen de beneficio y escalar de manera eficiente, se proponen las siguientes optimizaciones FinOps:

  1. Gestión de Tokens LLM: Aunque los costos de gpt-4o-mini son bajos, a medida que el volumen de documentos y la complejidad del análisis aumenten, los costos de LLM crecerán. Implementar caché de respuestas LLM es crucial para evitar re-procesar documentos o secciones idénticas. Además, la ingeniería de prompts para ser más concisos y extraer solo la información necesaria puede reducir significativamente los tokens de entrada y salida.
  2. Arquitectura Serverless para Procesamiento: El pipeline de ingesta y análisis de documentos es un candidato ideal para una arquitectura serverless (ej. AWS Lambda con SQS o GCP Cloud Functions). Esto permitiría pagar solo por el tiempo de cómputo real utilizado, eliminando la necesidad de instancias EC2 persistentes y optimizando costos para cargas de trabajo intermitentes o por lotes.
  3. Optimización de Base de Datos: Monitorear el rendimiento y el uso de la base de datos (PostgreSQL en RDS). Si los patrones de carga son esporádicos o variables, considerar una opción como Amazon Aurora Serverless v2 que ajusta la capacidad de forma dinámica, lo que podría generar ahorros sustanciales en comparación con instancias aprovisionadas fijas.
  4. Monitoreo Continuo y Alertas: Establecer herramientas de monitoreo de costos (ej. AWS Cost Explorer, GCP Cost Management) con alertas para detectar anomalías o aumentos inesperados. Esto es fundamental para una gestión proactiva de los gastos y para identificar nuevas oportunidades de ahorro a medida que la startup escala.
  5. Revisión de Tier de LLM: Aunque %%INLINE28%% es muy económico, si la calidad o complejidad de los análisis requeridos por los clientes de Fintech exigen modelos más potentes (como GPT-4 o Claude 3 Opus), los costos de LLM aumentarán drásticamente. Realizar pruebas A/B para validar si %%INLINE29%% cumple con las expectativas de calidad del nicho Fintech es vital; si no, planificar la transición y el impacto en los costos.

MVP FEATURES

  • 01Ingesta de Documentos: API y dashboard para subir documentos financieros (PDF, TXT) o procesarlos desde una URL pública (ej. filings de la SEC).
  • 02Análisis de Sentimiento Financiero: Clasificación automática del tono (positivo, negativo, neutral) de los documentos, con un modelo ajustado al léxico financiero específico.
  • 03Extracción de Entidades Clave (NER): Identificación y etiquetado automático de compañías, ejecutivos, métricas financieras (EBITDA, revenue), y eventos de mercado (M&A, anuncios de resultados).
  • 04Dashboard de Resultados: Interfaz web simple para visualizar los documentos procesados, su puntuación de sentimiento y las entidades extraídas de forma estructurada.
  • 05Alerta Básica por Palabras Clave: Configuración de alertas por email cuando se detectan ciertas palabras clave o entidades en un nuevo documento.

AI que transforma datos financieros en decisiones estratégicas.

Propongo revisar el MVP y los resultados de las simulaciones para planificar los próximos pasos de validación de mercado.

Related Startups