MiniMax-M3 is a multimodal foundation model from MiniMax. It supports text, image, and video inputs with text output, a 1M-token context window, and is suited for long-horizon agentic work, coding,...
Catégorie de performance
Flagship
Minimax M3 est un modèle flagship de Minimax : le plus performant de leur gamme.
Meilleur modèle de ce fournisseur. Performances maximales sur les benchmarks, idéal pour les tâches exigeantes.
Tarification
Ce modèle est inclus dans les plans Elosia
Abordable
Coût réduit. Adapté à un usage soutenu et aux interactions volumineuses.
Type
par 1M tokens
Entrée (prompt)
$0.300
Sortie (complétion)
$1.20
Lecture cache
$0.060
Capacités
Taille du contexte524K
Tokens de sortie max512K
TokenizerOther
Entréetext, image, video
Sortietext
Date de sortie31 mai 2026
Benchmarks
Intelligence générale
MMLU
Non reporté
GPQA Diamond
Non reporté
Mathématiques
MATH-500
Non reporté
Programmation
HumanEval
Non reporté
SWE-bench Verified
Non reporté
Raisonnement
IFEval
Non reporté
Agentique
SWE-bench Pro
59%
Usages recommandés
ProgrammationAnalyseRechercheExtraction de données
Points forts
Architecture MoE (~428B au total, 23B actifs) — solide codage agentique open-weight (SWE-bench Pro 59,0), devant GPT-5.5 et Gemini 3.1 Pro
Contexte de 1M tokens rendu efficace par MiniMax Sparse Attention (MSA) — accélération ~9× du prefill et ~15× du decode vs la génération précédente à 1M tokens
Entrée multimodale native incluant la vidéo — texte, image et vidéo dès la première étape d'entraînement, plus les workflows computer-use
Économique à $0,30/M en entrée et $1,20/M en sortie — une fraction du coût des modèles frontier comparables pour le codage agentique
Open-weight avec rapport technique complet (arXiv 2606.13392) — téléchargeable et auto-hébergeable
Limites
Benchmarks phares auto-rapportés par MiniMax ; vérification indépendante encore limitée
SWE-bench Pro 59,0 reste derrière le meilleur modèle fermé (Claude Opus 4.8, ~69) sur la modification de code pure
MoE de ~428B avec opérateur MSA personnalisé : auto-hébergement lourd ; les contextes au-delà de 512K sont facturés à un palier supérieur