GLM-5 Turbo is a new model from Z.ai designed for fast inference and strong performance in agent-driven environments such as OpenClaw scenarios. It is deeply optimized for real-world agent workflows involving long execution chains, with improved complex instruction decomposition, tool use, scheduled and persistent execution, and overall stability across extended tasks.
Catégorie de performance
Équilibré
Z.ai GLM 5 Turbo est un modèle équilibré de Z.ai : un bon compromis entre bonnes performances à un prix raisonnable.
Bon rapport coût-performance. Fiable pour la plupart des usages professionnels sans tarification premium.
Tarification
Ce modèle est inclus dans les plans Elosia
Type
par 1M tokens
Entrée (prompt)
$1.20
Sortie (complétion)
$4.00
Lecture cache
$0.240
Capacités
Taille du contexte203K
Tokens de sortie max131K
TokenizerOther
Entréetext
Sortietext
Date de sortie15 mars 2026
Benchmarks
Intelligence générale
MMLU
85%
GPQA Diamond
86%
Mathématiques
MATH-500
Non reporté
Programmation
HumanEval
90%
SWE-bench Verified
77.8%
Raisonnement
IFEval
88%
Usages recommandés
ProgrammationAnalyseChat généralExtraction de données
Points forts
Variante plus rapide et économique du flagship GLM 5, optimisée pour les workflows agentiques
Taux d'erreur d'appel d'outils extrêmement bas (0,67%) pour une orchestration fiable
Fenêtre de contexte de 200K tokens avec jusqu'à 128K tokens en sortie
Tarification compétitive ($0,96/M en entrée) par rapport aux modèles frontier occidentaux
Limites
Closed-source contrairement au modèle GLM 5 de base qui est open-weight
Retours communautaires limités en dehors du marché chinois