Alternativa a OpenAI · misma forma de integrarla

Tu factura de IA, fija cada mes.

Pon IA en tu producto con un coste mensual fijo, datos en Europa, Latam o EE.UU., y el mismo código que ya usas para ChatGPT. Sin sorpresas en el siguiente recibo, sin permanencia.

Probar en 5 minutos. Migración en una tarde. Servidores en Europa, Latam y EE.UU. RGPD y AI Act preparados
python · tres líneas para probar
from openai import OpenAI

client = OpenAI(
  base_url="https://api.tesseraai.cloud/v1",
  api_key="sk-tessera-…",
)
Por qué Tessera

Tres pilares. Sin letra pequeña.

Tu factura cabe en una celda

Tarifa fija mensual. La factura cabe en una celda. Sin sorpresas en Black Friday ni a fin de trimestre. Tu CFO firma sin pestañear y tú dejas de defender la varianza al comité financiero.

Datos en tu región, no en la de ellos

GPU físicamente en EU, LATAM o US, a tu elección. Tus datos no cruzan jurisdicción que no hayas firmado. RGPD y AI Act por arquitectura para EU; data-residency garantizada para US y LATAM. DPA disponible en todos los tiers, lista de subprocessors pública.

Si te vas, te vas en una tarde

API compatible con OpenAI v1. Modelos open-source con licencia Apache 2.0. Si decides irte, te vas en una tarde. La permanencia se gana cada mes, no se contractualiza.

Cómo funciona

Tres pasos. Una tarde.

  1. Paso 1: Eliges tu tier y región

    EU para empresas bajo RGPD, LATAM para soberanía sudamericana, US para empresas que prefieren residencia americana. La residencia se contrata, no se descubre en una página de status.

  2. Paso 2: Cambias una línea en tu código

    Tu cliente OpenAI sigue siendo el mismo. Solo apunta a api.tesseraai.cloud. El resto del SDK, tu código de Langchain o LlamaIndex y los prompts se quedan como están.

  3. Paso 3: Pagas tarifa plana mensual

    Una factura, una celda. Sin sorpresas en picos de tráfico. La permanencia se gana cada mes; no hay cláusulas de salida que rascar.

Probar tarda 5 minutos y 3 líneas de código. Migración completa con tests, un día con soporte directo del founder.
Comparativa honesta

Cómo nos comparamos con el resto.

Sin asteriscos. Si algo no aplica, ponemos un guion.

Característica Tessera OpenAI / Anthropic AWS Bedrock
Modelo de pricing Fijo mensualPer-token variablePer-token variable
Residencia del dato EU + LATAM + USUSMulti-región
Soporte ES / EN Sí, founder directoEN soloLimitado
Compatibilidad OpenAI v1 100%NativoVía adapter
SLA enterprise 99,5% – 99,95%99,9%99,9%
DPA RGPD firmado Sí (adendum)
Coste mensual ~5 M tokens/día 650 €~3.500 €~2.500 €
Benchmarks medidos

Números medidos, no prometidos.

Métricas tomadas en producción real, con 25 clientes simultáneos durante casi 2 horas seguidas. Ningún competidor per-token publica benchmarks de su propia infraestructura. Nosotros sí.

TTFT P95
350 ms
qwen3.6-35b-a3b
Success rate
99,95 %
8.000 requests · 0 errores de generación
Capacidad incluida
100 RPM
por cliente Pro · burst 200
Tokens validados
5,91 M
en sustained run de 1 h 50 min

Medido el 27-abr-2026 sobre RTX PRO 6000 Blackwell con 25 clientes simultáneos. Reporte completo (curva de saturación, noisy neighbor, long context) disponible bajo NDA.

Modelos incluidos

Un bundle. Cinco modelos abiertos. Cero upsell.

Todos los tiers acceden al catálogo completo. No facturamos por modelo. No hay tier "premium" que esconda el modelo bueno detrás de un paywall.

chat

Qwen 3.6-35B-A3B

Modelo conversacional principal. 32 K de contexto, modos direct y thinking conmutables por request. Ideal para asistentes, RAG y clasificación.

Apache 2.0
audio · transcripción

Whisper large-v3 + turbo

Transcripción multilingüe en dos sabores sobre el mismo endpoint: `large-v3` para precisión máxima y `large-v3-turbo` (decoder destilado) hasta ~54% más rápido en audio largo. ES, EN, PT, CA nativos.

MIT
audio · síntesis

Kokoro 82M TTS

Síntesis de voz natural con foco en español neutro. Latencias <200 ms, ideal para IVR y agentes conversacionales.

Ver las 54 voces →
Apache 2.0
embeddings

Qwen3-Embedding-8B

Embeddings para retrieval, clustering y búsqueda semántica. 4.096 dimensiones, multilingüe, optimizado para contextos largos.

Apache 2.0
reranker

Qwen3-Reranker-4B

Reranking de segunda etapa para RAG. Entrenado conjuntamente con Qwen3-Embedding-8B (misma familia, sin penalty por mezclar). Respuesta compatible con la API de Cohere — migración drop-in desde Cohere / Voyage / Jina.

Apache 2.0

Cuando publicamos un nuevo modelo, te avisamos un mes antes. Cláusula de model freeze 12 meses con upgrade gratuito opt-in.

Precios

Una factura. Una celda.

Tarifa fija, GPU dedicada en Pro y superiores, sin token-meter ni sobrecargos por estacionalidad.

sin compromiso
Tessera Async
200 €/mes

Para procesamiento nocturno y batch jobs.

  • Sin RPM, queue de jobs
  • Contexto 16 K
  • LLM + embeddings
  • SLA <30 s P95 (best-effort)
  • Sin Whisper / TTS
EmpezarTessera Async
Tessera Lite
450 €/mes

Para pymes pequeñas con un solo caso de uso.

  • 50 RPM sostenidos · burst 100 (5 min/h)
  • Bundle completo: LLM + embeddings + Whisper + TTS
  • Sublímites: embeddings 100 RPM · Whisper 10 RPM · TTS 10 RPM
  • Contexto 8 K default · hasta 32 K configurable
  • Modo thinking: 100 requests/mes
  • Email · respuesta <24 h hábiles
  • Región: EU, LATAM o US
EmpezarTessera Lite
Más popular
Tessera Pro
650 €/mes

Para producción típica de pyme mediana.

  • 200 RPM sostenidos · burst 400 (5 min/h)
  • Bundle completo sin sublímites operativos
  • Sublímites: embeddings 400 RPM · Whisper 30 RPM · TTS 30 RPM
  • Contexto 8 K default · hasta 32 K configurable
  • Modo thinking: 1.000 requests/mes
  • Email + chat · respuesta <8 h hábiles
  • Status page con métricas de tu uso
  • Región: EU, LATAM o US
EmpezarTessera Pro
Tessera Pro+
1.200 €/mes

Para alta concurrencia y context largo.

  • 500 RPM sostenidos · burst 700 (5 min/h)
  • Bundle completo sin sublímites adicionales
  • Contexto 32 K default · hasta 128 K configurable
  • Modo thinking: ilimitado
  • Prioridad de scheduling sobre Pro y Lite
  • Webhooks de eventos personalizados
  • Chat prioritario · respuesta <4 h hábiles
  • Región: EU, LATAM o US
EmpezarTessera Pro+
Tessera Scale
desde5.000 €/mes

Para producto integrado de muy alta concurrencia.

  • 5.000+ RPM (negociable según hardware)
  • Bundle completo + LoRA fine-tuning opcional
  • Contexto 128 K default · hasta 256 K nativo
  • Hardware dedicado a elegir
  • Modo thinking: ilimitado, prioridad alta
  • Prioridad máxima de scheduling
  • Slack compartido · respuesta <1 h hábil
  • Onboarding asistido por ingeniero senior
  • Región: EU, LATAM o US
Hablar con ventasTessera Scale
Tessera Enterprise
desde15.000 €/mes

Servidor dedicado, configuración a medida, RFP-ready.

  • Servidor 100 % dedicado (no multi-tenant)
  • RPM, contexto, SLA y modelos a medida
  • Hardware a elegir según workload
  • Compliance: SOC 2 Type I, ISO 27001 (in progress)
  • Soporte dedicado: founder + ingeniero senior
  • Compromiso de roadmap negociado
  • Despliegue: cloud Tessera, private cloud o on-premise
  • Fine-tuning con tus datos bajo NDA (opcional)
Hablar con ventasTessera Enterprise
Honestidad comercial

Para quién encaja Tessera. Y para quién no.

No competimos por precio puro contra los modelos cheap del mercado. Si te encaja, te ahorras dinero y dolores; si no te encaja, te lo decimos en la primera llamada.

Te encaja si

  • Gastas hoy 2.000–5.000 € al mes en frontier (GPT-5.5, Opus 4.7, Gemini Pro) y la varianza mensual te complica el reporting.
  • Tu DPO o tu departamento legal preguntan dónde viven físicamente los datos del cliente, y la respuesta importa.
  • Quieres consolidar facturas en lugar de mantener tres proveedores cloud distintos.
  • Necesitas soporte humano en español o inglés, en horario europeo, latinoamericano o americano, con respuesta acotada.
  • Tu equipo es producto, no ML — quieres un drop-in que funcione, no optimizar prompt caching para sacar un -90 %.

No te encaja si

  • Ya usas Gemini Flash-Lite o GPT-5.4 nano y te funciona — ahí ganas tú, no Tessera.
  • Tu carga es bursty extremo (de 0 a 10.000 RPM en segundos). Mejor serverless per-token que GPU dedicada.
  • Tienes equipo ML interno que optimiza cada prompt y exprime descuentos por volumen contractual con un hyperscaler.
  • Necesitas modelos cerrados específicos (GPT-4o image, Sora, Veo) que solo viven en su nube de origen.

Si tu caso está en la columna de la derecha, te lo decimos en la primera conversación. No empujamos contratos que no encajan.

Construido para developers, gobernado para enterprise

La pieza que tu equipo y tu DPO firman a la vez.

Documentación que un developer hojea en quince minutos. Compliance que un DPO valida el lunes.

Documentación con ejemplos reales

Snippets en Python, Node.js, Go y cURL para cada endpoint. Cookbook editable, errores documentados con causa y workaround.

Status page público

status.tesseraai.cloud. Latencias por región en tiempo real. Postmortems publicados en cinco días hábiles, antes que el cliente lo pida.

Webhooks de uso para tu billing

Eventos de consumo en cada request. Conecta tu propio sistema de chargeback o cost center sin pasar por dashboard.

Audit logs exportables

Logs firmados, exportables a tu bucket de S3 o GCS. Retención configurable para auditorías de DORA, SOC 2 y AI Act.

Probar Tessera son 5 minutos. La migración completa, un día.

API compatible con OpenAI v1, modelos abiertos sobre GPU dedicada en EU, LATAM o US. Factura plana cada mes, sin token-meter. Soporte directo del founder en español o inglés.

Empezar — probar Tessera Agendar llamada de 20 min