Xiaomi

MiMo v2.5 Pro

XiaomiFlagship
RaisonnementOutilsSortie structurée

À propos de ce modèle

MiMo-V2.5-Pro is Xiaomi’s flagship model, delivering strong performance in general agentic capabilities, complex software engineering, and long-horizon tasks, with top rankings on benchmarks such as ClawEval, GDPVal, and SWE-bench Pro....

Catégorie de performance

Flagship

MiMo v2.5 Pro est un modèle flagship de Xiaomi : le plus performant de leur gamme.

Meilleur modèle de ce fournisseur. Performances maximales sur les benchmarks, idéal pour les tâches exigeantes.

Tarification

Ce modèle est inclus dans les plans Elosia
Abordable

Coût réduit. Adapté à un usage soutenu et aux interactions volumineuses.

Typepar 1M tokens
Entrée (prompt)$0.435
Sortie (complétion)$0.870
Lecture cache$0.0036

Capacités

Taille du contexte1.0M
Tokens de sortie max131K
TokenizerOther
Entréetext
Sortietext
Date de sortie22 avril 2026

Benchmarks

Intelligence générale
MMLU
Non reporté
GPQA Diamond
86.6%
Mathématiques
MATH-500
Non reporté
Programmation
HumanEval
Non reporté
SWE-bench Verified
78.9%
Raisonnement
IFEval
Non reporté
Humanity's Last Exam
33.8%
Agentique
SWE-bench Pro
57.2%

Usages recommandés

ProgrammationAnalyseRechercheMathématiques

Points forts

  • Architecture MoE (1,02T au total, 42B actifs) sous licence MIT permissive — auto-hébergeable à un niveau de capacité frontier
  • Codage agentique long-terme (SWE-bench Verified 78,9), maintenant 1 000+ appels d'outils séquentiels sur le contexte de 1M tokens
  • Économe en tokens — qualité comparable avec 40-60% de tokens en moins que Claude Opus 4.6, Gemini 3.1 Pro et GPT-5.4 (annoncé par l'éditeur)
  • Codage agentique compétitif parmi les modèles open-weight (SWE-bench Pro 57,2)
  • Tarification agressive à $0,44/M en entrée et $0,87/M en sortie — bien en dessous des modèles frontier comparables

Limites

  • Uniquement texte — pas d'entrée image, audio ou vidéo (la capacité omni-modale est portée par le modèle distinct MiMo-V2.5)
  • Scores phares auto-rapportés ; vérification indépendante limitée, et un harnais externe mesure Terminal-Bench nettement sous le chiffre de l'éditeur
  • Inférence plus lente que les pairs (~45-52 tokens/s) malgré le prix bas

Ressources

Ce modèle peut utiliser vos données pour l'entraînement

Modèles similaires