Modelos disponibles

Catálogo incluido

Todos los tiers acceden al mismo catálogo. La diferencia entre tiers está en capacidad, SLA, soporte, contexto y prioridad, no en esconder modelos detrás de un plan premium.

Modelo	Endpoint	Uso principal	Licencia
Qwen/Qwen3.6-35B-A3B	/v1/chat/completions	Chat, RAG, clasificación, extracción	Apache 2.0
Qwen3-Embedding-8B	/v1/embeddings	Búsqueda semántica y retrieval	Apache 2.0
Qwen3-Reranker-4B	/v1/rerank	Reranking de segunda etapa para RAG	Apache 2.0
Whisper large-v3	/v1/audio/transcriptions	Transcripción multilingüe	MIT
Kokoro 82M TTS	/v1/audio/speech	Voz para IVR y agentes	Apache 2.0

Compatibilidad práctica

Usa el SDK oficial de OpenAI cambiando `base_url` a `https://api.tesseraai.cloud/v1`.
Mantén tus estructuras `messages`, `tools`, `response_format` y streaming cuando el endpoint lo soporte.
Los nombres comerciales de modelo pueden mapearse internamente para preservar estabilidad contractual.

Model freeze y upgrades

Los contratos pueden fijar una familia de modelo durante 12 meses. Los upgrades se ofrecen como opt-in para evitar cambios silenciosos en calidad, coste de tokens o latencia.