Grok

Grok 4.20 Beta

GrokFlagship

Catégorie de performance

Flagship

Grok 4.20 Beta est un modèle flagship de Grok : le plus performant de leur gamme.

Meilleur modèle de ce fournisseur. Performances maximales sur les benchmarks, idéal pour les tâches exigeantes.

Capacités

Taille du contexte
Tokens de sortie max

Benchmarks

Intelligence générale
MMLU
Non reporté
GPQA Diamond
88.5%
Mathématiques
MATH-500
Non reporté
Programmation
HumanEval
Non reporté
SWE-bench Verified
Non reporté
Raisonnement
IFEval
Non reporté

Usages recommandés

ProgrammationAnalyseRechercheChat généralÉcriture créative

Points forts

  • Architecture interne à 4 agents réduisant les hallucinations de 65% (de ~12% à ~4,2%)
  • Fenêtre de contexte de 2M tokens, la plus grande du marché, pour l'analyse de documents massifs
  • Compréhension multimodale native (texte, image, vidéo) avec accès aux données X en temps réel
  • Top 5 au classement LMArena — compétitif avec Claude Opus et GPT-5.4

Limites

  • Encore en bêta — performances et disponibilité susceptibles d'évoluer
  • Tarification premium ($2,00/M en entrée) comparée aux variantes Grok 4 Fast
  • Écosystème tiers plus restreint que celui d'OpenAI/Anthropic

Ressources

Ce modèle peut utiliser vos données pour l'entraînement

Modèles similaires