GPT

GPT-5.3 Codex

GPTSpécialisé
RaisonnementOutilsVisionSortie structurée

À propos de ce modèle

GPT-5.3-Codex is OpenAI’s most advanced agentic coding model, combining the frontier software engineering performance of GPT-5.2-Codex with the broader reasoning and professional knowledge capabilities of GPT-5.2. It achieves state-of-the-art results on SWE-Bench Pro and strong performance on Terminal-Bench 2.0 and OSWorld-Verified, reflecting improved multi-language coding, terminal proficiency, and real-world computer-use skills. The model is optimized for long-running, tool-using workflows and supports interactive steering during execution, making it suitable for complex development tasks, debugging, deployment, and iterative product work. Beyond coding, GPT-5.3-Codex performs strongly on structured knowledge-work benchmarks such as GDPval, supporting tasks like document drafting, spreadsheet analysis, slide creation, and operational research across domains. It is trained with enhanced cybersecurity awareness, including vulnerability identification capabilities, and deployed with additional safeguards for high-risk use cases. Compared to prior Codex models, it is more token-efficient and approximately 25% faster, targeting professional end-to-end workflows that span reasoning, execution, and computer interaction.

Catégorie de performance

Spécialisé

GPT-5.3 Codex est un modèle spécialisé de GPT : conçu pour un domaine précis.

Modèle spécialisé. Optimisé pour une tâche spécifique comme la génération de code, la création d'images ou la recherche web.

Tarification

Ce modèle est inclus dans les plans Elosia
Typepar 1M tokens
Entrée (prompt)$1.75
Sortie (complétion)$14.00
Lecture cache$0.175

Capacités

Taille du contexte400K
Tokens de sortie max128K
TokenizerGPT
Entréetext, image, file
Sortietext
Date de sortie24 février 2026

Benchmarks

Intelligence générale
MMLU
93%
GPQA Diamond
81%
Mathématiques
MATH-500
96%
Programmation
HumanEval
93%
Raisonnement
IFEval
94%
Multimodalité
MMMU-Pro
64%
Agentique
Terminal-Bench 2.0
77.3%

Usages recommandés

ProgrammationAnalyseRecherche

Points forts

  • Unifie codage de pointe et raisonnement général en un seul modèle
  • 25% plus rapide que GPT-5.2-Codex avec une qualité comparable ou supérieure
  • Score record sur Terminal-Bench 2.0 (77.3%) pour les tâches de codage réelles
  • Solides connaissances professionnelles et couverture large des benchmarks (MMLU 93%)

Limites

  • Tarification premium
  • Principalement optimisé pour le code — la conversation générale peut être moins naturelle que GPT-5.2

Ressources

Ce modèle peut utiliser vos données pour l'entraînement

Modèles similaires