Compromisos de Servicio (SLA)
Versión 1.0 · Vigente desde 1 de mayo de 2026
Introducción
En Tessera creemos que un SLA debe ser concreto, verificable y compensable. Cada compromiso de este documento se basa en métricas medidas, no en estimaciones, y el incumplimiento genera créditos automáticos en la siguiente factura. Esta página es la fuente única de verdad de nuestros compromisos. Si encuentras una discrepancia entre este documento y un contrato firmado, prevalece el contrato.
Definiciones
- Uptime mensual
- Porcentaje del mes natural en que la API api.tesseraai.cloud/v1 responde con códigos 2xx o 4xx legítimos. Las respuestas 5xx causadas por Tessera y los timeouts cuentan como tiempo no disponible.
- TTFT (Time To First Token)
- Tiempo entre que el gateway recibe el request y emite el primer token de la respuesta del modelo, medido en milisegundos. Excluye latencia de red entre cliente y gateway.
- E2E latency
- Tiempo total entre la entrada del request en el gateway y la emisión del último token, medido en segundos.
- Success rate
- Porcentaje de requests que devuelven una respuesta con contenido válido del modelo, sin errores 5xx ni truncados por fallo interno. Excluye errores 4xx imputables al cliente.
- Mantenimiento programado
- Operación de actualización o configuración planificada con antelación mínima fijada por tier. Se ejecuta preferentemente en ventanas de menor tráfico.
- Mantenimiento de emergencia
- Operación urgente para mitigar una vulnerabilidad crítica (CVE 9.0 o superior) o un incidente activo. No requiere preaviso pero se documenta a posteriori.
- Crédito de servicio
- Compensación económica aplicada como reducción en la siguiente factura del cliente, calculada como porcentaje sobre la cuota mensual del tier afectado.
- Período de medición
- Mes natural (del día 1 al último día del mes), zona horaria Europe/Madrid. Las métricas se calculan al cierre del mes sobre el conjunto agregado de requests del cliente.
Compromisos por tier
La siguiente tabla resume los compromisos por tier. Los valores son contractuales y se miden según las definiciones anteriores.
| Compromiso | Lite | Pro | Pro+ | Scale | Enterprise |
|---|---|---|---|---|---|
| Uptime mensual | 99,0 % | 99,5 % | 99,5 % | 99,9 % | 99,95 % (negociable hasta 99,99 %) |
| TTFT P95 con context ≤ 16 K | < 3 s | < 2 s | < 2 s | < 1 s | a medida |
| TTFT P95 con context 16 K – 64 K | no aplica | < 5 s (best-effort) | < 10 s | < 5 s | a medida |
| TTFT P95 con context 64 K – 128 K | no aplica | no aplica | < 30 s | < 20 s | a medida |
| TTFT P95 con context 128 K – 256 K+ | no aplica | no aplica | no aplica | < 60 s (con caveats) | a medida |
| Success rate de generación | 99,5 % | 99,5 % | 99,5 % | 99,5 % | 99,5 % |
| Tiempo respuesta soporte (días hábiles) | 24 h | 8 h | 4 h | 1 h | 30 min |
| Tiempo respuesta incidencia P1 (servicio caído) | 4 h | 2 h | 1 h | 30 min | 15 min (24 / 7) |
| Notificación de mantenimiento programado | 48 h | 72 h | 7 días | 14 días | 30 días + ventana negociada |
| Tiempo máximo mantenimiento programado / mes | 4 h | 2 h | 1 h | 30 min (o 0 con redundancia activa) | 0 |
Tessera Lite ver compromisos
- Uptime mensual
- 99,0 %
- TTFT P95 con context ≤ 16 K
- < 3 s
- TTFT P95 con context 16 K – 64 K
- no aplica
- TTFT P95 con context 64 K – 128 K
- no aplica
- TTFT P95 con context 128 K – 256 K+
- no aplica
- Success rate de generación
- 99,5 %
- Tiempo respuesta soporte (días hábiles)
- 24 h
- Tiempo respuesta incidencia P1 (servicio caído)
- 4 h
- Notificación de mantenimiento programado
- 48 h
- Tiempo máximo mantenimiento programado / mes
- 4 h
Tessera Pro ver compromisos
- Uptime mensual
- 99,5 %
- TTFT P95 con context ≤ 16 K
- < 2 s
- TTFT P95 con context 16 K – 64 K
- < 5 s (best-effort)
- TTFT P95 con context 64 K – 128 K
- no aplica
- TTFT P95 con context 128 K – 256 K+
- no aplica
- Success rate de generación
- 99,5 %
- Tiempo respuesta soporte (días hábiles)
- 8 h
- Tiempo respuesta incidencia P1 (servicio caído)
- 2 h
- Notificación de mantenimiento programado
- 72 h
- Tiempo máximo mantenimiento programado / mes
- 2 h
Tessera Pro+ ver compromisos
- Uptime mensual
- 99,5 %
- TTFT P95 con context ≤ 16 K
- < 2 s
- TTFT P95 con context 16 K – 64 K
- < 10 s
- TTFT P95 con context 64 K – 128 K
- < 30 s
- TTFT P95 con context 128 K – 256 K+
- no aplica
- Success rate de generación
- 99,5 %
- Tiempo respuesta soporte (días hábiles)
- 4 h
- Tiempo respuesta incidencia P1 (servicio caído)
- 1 h
- Notificación de mantenimiento programado
- 7 días
- Tiempo máximo mantenimiento programado / mes
- 1 h
Tessera Scale ver compromisos
- Uptime mensual
- 99,9 %
- TTFT P95 con context ≤ 16 K
- < 1 s
- TTFT P95 con context 16 K – 64 K
- < 5 s
- TTFT P95 con context 64 K – 128 K
- < 20 s
- TTFT P95 con context 128 K – 256 K+
- < 60 s (con caveats)
- Success rate de generación
- 99,5 %
- Tiempo respuesta soporte (días hábiles)
- 1 h
- Tiempo respuesta incidencia P1 (servicio caído)
- 30 min
- Notificación de mantenimiento programado
- 14 días
- Tiempo máximo mantenimiento programado / mes
- 30 min (o 0 con redundancia activa)
Tessera Enterprise ver compromisos
- Uptime mensual
- 99,95 % (negociable hasta 99,99 %)
- TTFT P95 con context ≤ 16 K
- a medida
- TTFT P95 con context 16 K – 64 K
- a medida
- TTFT P95 con context 64 K – 128 K
- a medida
- TTFT P95 con context 128 K – 256 K+
- a medida
- Success rate de generación
- 99,5 %
- Tiempo respuesta soporte (días hábiles)
- 30 min
- Tiempo respuesta incidencia P1 (servicio caído)
- 15 min (24 / 7)
- Notificación de mantenimiento programado
- 30 días + ventana negociada
- Tiempo máximo mantenimiento programado / mes
- 0
Créditos por incumplimiento
Cuando un compromiso no se cumple en un período de medición, el cliente recibe un crédito calculado sobre la cuota mensual del tier afectado. Los porcentajes son acumulativos por categoría dentro del mismo mes.
Uptime mensual por debajo del comprometido
| Diferencia frente al compromiso | Crédito |
|---|---|
| 0,1 % – 1 % | 10 % de la cuota mensual |
| 1 % – 5 % | 25 % de la cuota mensual |
| 5 % – 10 % | 50 % de la cuota mensual |
| Más del 10 % | 100 % de la cuota mensual + opción de cancelación sin penalización |
TTFT P95 que excede el compromiso (mes natural)
| Diferencia frente al compromiso | Crédito |
|---|---|
| Hasta 50 % | 5 % de la cuota mensual |
| 50 % – 100 % | 15 % de la cuota mensual |
| Más del 100 % | 25 % de la cuota mensual |
Success rate por debajo del 99,5 %
| Diferencia frente al compromiso | Crédito |
|---|---|
| 99,0 % – 99,4 % | 10 % de la cuota mensual |
| 98,0 % – 98,9 % | 25 % de la cuota mensual |
| Por debajo del 98 % | 50 % de la cuota mensual + revisión técnica conjunta obligatoria |
Incumplimiento del tiempo de respuesta de soporte
| Incidencias en el mes | Crédito |
|---|---|
| 1 incidencia | Aviso interno, sin crédito |
| 2 – 3 incidencias | 5 % de la cuota mensual |
| Más de 3 incidencias | 10 % de la cuota mensual |
Los créditos se calculan sobre la cuota mensual del tier contratado. Se aplican automáticamente en la siguiente factura tras verificación con los logs internos de Tessera. El cliente puede solicitar revisión manual si discrepa con el cálculo.
Exclusiones
Los siguientes casos no cuentan como incumplimiento y no generan crédito:
- Mantenimiento programado con la antelación pactada por tier.
- Mantenimiento de emergencia para mitigar una vulnerabilidad crítica (CVE 9.0 o superior).
- Caídas de proveedores upstream (Cloudflare, raíces DNS, hyperscaler regional). Tessera proporcionará evidencia documentada del origen externo.
- Uso del cliente fuera de los límites del tier (RPM excedido, contexto superior al máximo, etc.).
- Caídas causadas por código del cliente, incluyendo bucles infinitos, mal manejo de errores y patrones de retry abusivos.
- Fuerza mayor: catástrofes naturales, conflictos armados, decisiones gubernamentales o sanciones internacionales.
- Suspensión por impago confirmado tras 30 días.
- Solicitudes que excedan límites razonables documentados (Whisper para audio > 2 h, TTS para texto > 50 K caracteres, batches de embeddings > 10 K documentos por request).
Procedimiento de reclamación
- El cliente identifica el incumplimiento usando los logs de su cuenta o las métricas publicadas en status.tesseraai.cloud.
- Abre un ticket en [email protected] con asunto SLA Claim: [descripción breve].
- Tessera responde en un plazo máximo igual al tiempo de respuesta de soporte de su tier, con un análisis preliminar.
- Si el incumplimiento se confirma, el crédito se aplica automáticamente en la siguiente factura.
- Si el cliente discrepa con el análisis, se escala a revisión técnica conjunta entre el founder y un ingeniero senior, con resolución en un máximo de cinco días hábiles.
Status page y medición
Tessera publica métricas de servicio en tiempo real en status.tesseraai.cloud. Las métricas mostradas son la fuente única de verdad para la verificación del SLA. Toda métrica se mide desde los gateways internos sobre requests reales de clientes, no desde sondas sintéticas externas. Esto significa que las métricas reflejan la experiencia real, no un proxy.
- Datos retenidos durante 90 días para verificación retrospectiva.
- Histórico mensual de uptime publicado el día 5 del mes siguiente.
- El cliente puede exportar sus métricas individuales vía API en cualquier momento.
- Audit logs disponibles para tiers Pro+, Scale y Enterprise, con exportación a buckets propios de S3 o GCS.
Casos especiales
9.1 Long context (más de 16 K tokens)
Los SLA de TTFT para context superior a 16 K reflejan la realidad física del modelo: a más tokens, más tiempo de cómputo. Si el caso de uso requiere context largo de forma intensiva, se recomienda evaluar Tessera Pro+ o Scale para garantías más estrictas.
9.2 Modo thinking
El modo thinking (reasoning extendido) no está cubierto por el SLA de TTFT. La latencia en modo thinking es típicamente diez veces la del modo direct y depende de la complejidad de la tarea. Cada tier dispone de una cuota mensual de modo thinking documentada en su plan.
9.3 Bundle de servicios (embeddings, rerank, Whisper, TTS)
Los servicios del bundle tienen un SLA de uptime y success rate idéntico al del LLM principal. Los SLA de TTFT no aplican a estos servicios; cada uno tiene una métrica equivalente:
- Embeddings: latencia P95 inferior a 500 ms para batches de hasta 100 documentos.
- Whisper: real-time factor inferior a 0,5 (procesa una hora de audio en menos de 30 minutos).
- TTS: latencia P95 inferior a 2 s para textos de hasta 500 caracteres.
9.4 Failover transparente
Tessera utiliza routing inteligente entre múltiples proveedores GPU. Cuando un proveedor primario sufre degradación, el tráfico se enruta automáticamente a proveedores secundarios. Durante el failover, el modelo servido puede variar (siempre dentro de la familia Qwen 3.x compatible) sin afectar a la API. El SLA aplica al servicio agregado, no a un servidor concreto.
Contacto
- Cuestiones legales sobre el SLA: [email protected]
- Reclamaciones de incumplimiento: [email protected]
Historial de cambios
| Versión | Fecha | Cambios |
|---|---|---|
| 1.0 | 2026-05-01 | Publicación inicial. |