Grok 4 Fast is xAI's latest multimodal model with SOTA cost-efficiency and a 2M token context window. It comes in two flavors: non-reasoning and reasoning. Read more about the model on xAI's [news post](http://x.ai/news/grok-4-fast).
Reasoning can be enabled/disabled using the `reasoning` `enabled` parameter in the API. [Learn more in our docs](https://openrouter.ai/docs/use-cases/reasoning-tokens#controlling-reasoning-tokens)
Catégorie de performance
Équilibré
Grok 4 Fast est un modèle équilibré de Grok : un bon compromis entre bonnes performances à un prix raisonnable.
Bon rapport coût-performance. Fiable pour la plupart des usages professionnels sans tarification premium.
Tarification
Ce modèle est inclus dans les plans Elosia
Type
par 1M tokens
Entrée (prompt)
$0.200
Sortie (complétion)
$0.500
Lecture cache
$0.050
Capacités
Taille du contexte2.0M
Tokens de sortie max30K
TokenizerGrok
Entréetext, image, file
Sortietext
Date de sortie19 septembre 2025
Benchmarks
Intelligence générale
MMLU
87.8%
Mathématiques
MATH-500
85%
AIME 2025
92%
Programmation
HumanEval
90.5%
LiveCodeBench
80%
Raisonnement
Humanity's Last Exam
20%
Usages recommandés
Chat généralProgrammationÉcriture créativeRésumé
Points forts
Variante rapide de Grok 4 conservant la majorité de ses capacités
Solides performances en programmation et mathématiques avec une latence réduite
Adapté aux applications conversationnelles en temps réel
Limites
Précision légèrement inférieure au Grok 4 complet
Moins adapté au raisonnement complexe multi-étapes