Conceptos

Tiers y límites

Los límites de Tessera protegen la capacidad dedicada y hacen que la factura plana siga siendo predecible para cada cliente.

Resumen por tier

TierRPM sostenidoBurstContextoThinking
AsyncQueueNo aplica16 KNo recomendado
Lite50100 durante 5 min/h8 K default · 32 K configurable100 req/mes
Pro200400 durante 5 min/h8 K default · 32 K configurable1.000 req/mes
Pro+500700 durante 5 min/h16 K default · 32 K configurableIlimitado
Scale5.000+NegociableA medidaIlimitado · prioridad alta

Sublímites del bundle

  • Embeddings tienen cuota separada para no bloquear tráfico conversacional.
  • Whisper y TTS se limitan por RPM y tamaño razonable de audio o texto.
  • Los 429 deben tratarse con backoff exponencial y reintentos con jitter.

Qué ocurre al superar un límite

La API devuelve `429` con metadatos suficientes para reintentar. En planes Pro y superiores se puede pactar un burst mayor o mover cargas batch al tier Async.