GLM-5.1 delivers a major leap in coding capability, with particularly significant gains in handling long-horizon tasks. Unlike previous models built around minute-level interactions, GLM-5.1 can work independently and continuously on...
Catégorie de performance
Équilibré
Z.ai GLM 5.1 est un modèle équilibré de Z.ai : un bon compromis entre bonnes performances à un prix raisonnable.
Bon rapport coût-performance. Fiable pour la plupart des usages professionnels sans tarification premium.
Tarification
Ce modèle est inclus dans les plans Elosia
Modéré
Coût modéré. Bon équilibre pour un usage régulier sans surveillance constante du cap.
Type
par 1M tokens
Entrée (prompt)
$0.980
Sortie (complétion)
$3.08
Lecture cache
$0.490
Capacités
Taille du contexte203K
Tokens de sortie max66K
TokenizerOther
Entréetext
Sortietext
Date de sortie7 avril 2026
Benchmarks
Intelligence générale
MMLU
Non reporté
GPQA Diamond
86.2%
Mathématiques
MATH-500
Non reporté
Programmation
HumanEval
Non reporté
SWE-bench Verified
77.8%
LiveCodeBench
52%
Raisonnement
Humanity's Last Exam
52.3%
Agentique
SWE-bench Pro
58.4%
Terminal-Bench 2.0
69%
Usages recommandés
ProgrammationAnalyseRechercheChat général
Points forts
Modèle MoE de 754B (40B actifs), solide codeur agentique sur SWE-Bench Pro (58,4) — surpassé par GLM 5.2 pour les usages frontier
Codage agentique long-terme, exécution autonome jusqu'à 8 heures sur une seule tâche
Fenêtre de contexte de 200K tokens avec jusqu'à 131K tokens en sortie
Licence MIT open-weight, auto-hébergeable, entraîné entièrement sur puces Huawei
Tarification compétitive ($0,95/M entrée, $3,15/M sortie) face aux modèles frontier occidentaux
Limites
Uniquement texte : pas de capacités multimodales (image/audio)
Écosystème d'intégrations et d'outillage plus restreint en dehors du marché chinois
Benchmarks auto-rapportés, vérification indépendante encore limitée