Minimax M3

MinimaxFlagship

RaisonnementOutilsVisionSortie structurée

À propos de ce modèle

MiniMax-M3 is a multimodal foundation model from MiniMax. It supports text, image, and video inputs with text output, a 1M-token context window, and is suited for long-horizon agentic work, coding,...

Catégorie de performance

Flagship

Minimax M3 est un modèle flagship de Minimax : le plus performant de leur gamme.

Meilleur modèle de ce fournisseur. Performances maximales sur les benchmarks, idéal pour les tâches exigeantes.

Tarification

Ce modèle est inclus dans les plans Elosia

Abordable

Coût réduit. Adapté à un usage soutenu et aux interactions volumineuses.

Type	par 1M tokens
Entrée (prompt)	$0.300
Sortie (complétion)	$1.20
Lecture cache	$0.060

Capacités

Taille du contexte524K

Tokens de sortie max512K

TokenizerOther

Entréetext, image, video

Sortietext

Date de sortie31 mai 2026

Benchmarks

Intelligence générale

MMLU

Non reporté

GPQA Diamond

Non reporté

Mathématiques

MATH-500

Non reporté

Programmation

HumanEval

Non reporté

SWE-bench Verified

Non reporté

Raisonnement

IFEval

Non reporté

Agentique

SWE-bench Pro

59%

Usages recommandés

ProgrammationAnalyseRechercheExtraction de données

Points forts

Architecture MoE (~428B au total, 23B actifs) — solide codage agentique open-weight (SWE-bench Pro 59,0), devant GPT-5.5 et Gemini 3.1 Pro
Contexte de 1M tokens rendu efficace par MiniMax Sparse Attention (MSA) — accélération ~9× du prefill et ~15× du decode vs la génération précédente à 1M tokens
Entrée multimodale native incluant la vidéo — texte, image et vidéo dès la première étape d'entraînement, plus les workflows computer-use
Économique à $0,30/M en entrée et $1,20/M en sortie — une fraction du coût des modèles frontier comparables pour le codage agentique
Open-weight avec rapport technique complet (arXiv 2606.13392) — téléchargeable et auto-hébergeable

Limites

Benchmarks phares auto-rapportés par MiniMax ; vérification indépendante encore limitée
SWE-bench Pro 59,0 reste derrière le meilleur modèle fermé (Claude Opus 4.8, ~69) sur la modification de code pure
MoE de ~428B avec opérateur MSA personnalisé : auto-hébergement lourd ; les contextes au-delà de 512K sont facturés à un palier supérieur

Ressources

Documentation officielle huggingface

Ce modèle peut utiliser vos données pour l'entraînement

Modèles similaires

Minimax

Claude

Claude

DeepSeek