Grok 4.20 Beta

GrokFlagship

Catégorie de performance

Flagship

Grok 4.20 Beta est un modèle flagship de Grok : le plus performant de leur gamme.

Meilleur modèle de ce fournisseur. Performances maximales sur les benchmarks, idéal pour les tâches exigeantes.

Taille du contexte—

Tokens de sortie max—

Intelligence générale

MMLU

Non reporté

GPQA Diamond

88.5%

Mathématiques

MATH-500

Non reporté

Programmation

HumanEval

Non reporté

SWE-bench Verified

Non reporté

Raisonnement

IFEval

Non reporté

ProgrammationAnalyseRechercheChat généralÉcriture créative

Architecture interne à 4 agents réduisant les hallucinations de 65% (de ~12% à ~4,2%)
Fenêtre de contexte de 2M tokens, la plus grande du marché, pour l'analyse de documents massifs
Compréhension multimodale native (texte, image, vidéo) avec accès aux données X en temps réel
Top 5 au classement LMArena — compétitif avec Claude Opus et GPT-5.4

Ce modèle peut utiliser vos données pour l'entraînement

Gemini

Claude

Claude

GPT