Catálogo incluido
Todos los tiers acceden al mismo catálogo. La diferencia entre tiers está en capacidad, SLA, soporte, contexto y prioridad, no en esconder modelos detrás de un plan premium.
| Modelo | Endpoint | Uso principal | Licencia |
|---|---|---|---|
| Qwen/Qwen3.6-35B-A3B | /v1/chat/completions | Chat, RAG, clasificación, extracción | Apache 2.0 |
| Qwen3-Embedding-8B | /v1/embeddings | Búsqueda semántica y retrieval | Apache 2.0 |
| Qwen3-Reranker-4B | /v1/rerank | Reranking de segunda etapa para RAG | Apache 2.0 |
| Whisper large-v3 | /v1/audio/transcriptions | Transcripción multilingüe | MIT |
| Kokoro 82M TTS | /v1/audio/speech | Voz para IVR y agentes | Apache 2.0 |
Compatibilidad práctica
- Usa el SDK oficial de OpenAI cambiando `base_url` a `https://api.tesseraai.cloud/v1`.
- Mantén tus estructuras `messages`, `tools`, `response_format` y streaming cuando el endpoint lo soporte.
- Los nombres comerciales de modelo pueden mapearse internamente para preservar estabilidad contractual.
Model freeze y upgrades
Los contratos pueden fijar una familia de modelo durante 12 meses. Los upgrades se ofrecen como opt-in para evitar cambios silenciosos en calidad, coste de tokens o latencia.