MiMo v2.5 Pro

XiaomiFlagship

RaisonnementOutilsSortie structurée

À propos de ce modèle

MiMo-V2.5-Pro is Xiaomi’s flagship model, delivering strong performance in general agentic capabilities, complex software engineering, and long-horizon tasks, with top rankings on benchmarks such as ClawEval, GDPVal, and SWE-bench Pro....

Catégorie de performance

Flagship

MiMo v2.5 Pro est un modèle flagship de Xiaomi : le plus performant de leur gamme.

Meilleur modèle de ce fournisseur. Performances maximales sur les benchmarks, idéal pour les tâches exigeantes.

Tarification

Ce modèle est inclus dans les plans Elosia

Abordable

Coût réduit. Adapté à un usage soutenu et aux interactions volumineuses.

Type	par 1M tokens
Entrée (prompt)	$0.435
Sortie (complétion)	$0.870
Lecture cache	$0.0036

Capacités

Taille du contexte1.0M

Tokens de sortie max131K

TokenizerOther

Entréetext

Sortietext

Date de sortie22 avril 2026

Benchmarks

Intelligence générale

MMLU

Non reporté

GPQA Diamond

86.6%

Mathématiques

MATH-500

Non reporté

Programmation

HumanEval

Non reporté

SWE-bench Verified

78.9%

Raisonnement

IFEval

Non reporté

Humanity's Last Exam

33.8%

Agentique

SWE-bench Pro

57.2%

Usages recommandés

ProgrammationAnalyseRechercheMathématiques

Points forts

Architecture MoE (1,02T au total, 42B actifs) sous licence MIT permissive — auto-hébergeable à un niveau de capacité frontier
Codage agentique long-terme (SWE-bench Verified 78,9), maintenant 1 000+ appels d'outils séquentiels sur le contexte de 1M tokens
Économe en tokens — qualité comparable avec 40-60% de tokens en moins que Claude Opus 4.6, Gemini 3.1 Pro et GPT-5.4 (annoncé par l'éditeur)
Codage agentique compétitif parmi les modèles open-weight (SWE-bench Pro 57,2)
Tarification agressive à $0,44/M en entrée et $0,87/M en sortie — bien en dessous des modèles frontier comparables

Limites

Uniquement texte — pas d'entrée image, audio ou vidéo (la capacité omni-modale est portée par le modèle distinct MiMo-V2.5)
Scores phares auto-rapportés ; vérification indépendante limitée, et un harnais externe mesure Terminal-Bench nettement sous le chiffre de l'éditeur
Inférence plus lente que les pairs (~45-52 tokens/s) malgré le prix bas

Ressources

Documentation officielle huggingface

Ce modèle peut utiliser vos données pour l'entraînement

Modèles similaires

Xiaomi

Claude

Claude

DeepSeek