Qwen3.7-Plus is a cost-effective model in Alibaba's Qwen3.7 series. It supports text and image input with text output, building on the series' text capabilities with a comprehensive upgrade to its...
Catégorie de performance
Équilibré
Qwen 3.7 Plus est un modèle équilibré de Qwen : un bon compromis entre bonnes performances à un prix raisonnable.
Bon rapport coût-performance. Fiable pour la plupart des usages professionnels sans tarification premium.
Tarification
Ce modèle est inclus dans les plans Elosia
Abordable
Coût réduit. Adapté à un usage soutenu et aux interactions volumineuses.
Type
par 1M tokens
Entrée (prompt)
$0.320
Sortie (complétion)
$1.28
Lecture cache
$0.064
Écriture cache
$0.400
Capacités
Taille du contexte1.0M
Tokens de sortie max66K
TokenizerQwen
Entréetext, image
Sortietext
Date de sortie3 juin 2026
Benchmarks
Intelligence générale
MMLU
Non reporté
GPQA Diamond
90.3%
Mathématiques
MATH-500
Non reporté
AIME 2025
93.3%
Programmation
HumanEval
Non reporté
Agentique
SWE-bench Pro
57.6%
Usages recommandés
ProgrammationAnalyseRechercheExtraction de données
Points forts
Variante agent multimodale de la lignée Qwen3.7 — entrée native texte, image et vidéo pour la perception de scènes, la lecture d'écran et le contrôle d'interfaces
Fenêtre de contexte de 1M tokens pour les workflows agentiques sur dépôts entiers et documents longs, avec un solide rappel en contexte long
Raisonnement mathématique au niveau du flagship Qwen3.7 Max (AIME 2025 93,3, vérifié indépendamment) à une fraction du coût
Coût bas pour sa catégorie à $0,32/M en entrée et $1,28/M en sortie — environ 60% moins cher en entrée que le palier Max
Solide profil d'agent GUI / computer-use — compréhension d'écran, usage d'outils et code à partir de références visuelles
Limites
Propriétaire et closed-weight — pas de checkpoint téléchargeable, contrairement à la tradition open-weight de Qwen ; déploiement API uniquement
En retrait du palier Qwen3.7 Max sur les benchmarks texte difficiles (GPQA Diamond 90,3 vs 92,4 pour Max)
Suites texte standard peu publiées et benchmarks majoritairement auto-rapportés — vérification indépendante limitée ; verbosité de sortie élevée notée