Gemini

Gemini 3.1 Flash Lite

GeminiCompact
RaisonnementOutilsVisionSortie structurée

À propos de ce modèle

Gemini 3.1 Flash Lite Preview is Google's high-efficiency model optimized for high-volume use cases. It outperforms Gemini 2.5 Flash Lite on overall quality and approaches Gemini 2.5 Flash performance across...

Catégorie de performance

Compact

Gemini 3.1 Flash Lite est un modèle compact de Gemini : petit, rapide et abordable, optimisé pour la vitesse et le coût.

Petit, rapide et économique. Optimisé pour la vitesse et le faible coût, idéal pour les tâches simples ou à fort volume.

Tarification

Ce modèle est inclus dans les plans Elosia
Abordable

Coût réduit. Adapté à un usage soutenu et aux interactions volumineuses.

Typepar 1M tokens
Entrée (prompt)$0.250
Sortie (complétion)$1.50
Image$0.250
Raisonnement interne$1.50
Lecture cache$0.025
Écriture cache$0.083

Capacités

Taille du contexte1.0M
Tokens de sortie max66K
TokenizerGemini
Entréetext, image, video, file, audio
Sortietext
Date de sortie3 mars 2026

Benchmarks

Intelligence générale
MMLU
88.9%
GPQA Diamond
86.9%
Mathématiques
MATH-500
Non reporté
Programmation
HumanEval
Non reporté
Raisonnement
Humanity's Last Exam
16%
Multimodalité
MMMU-Pro
76.8%

Usages recommandés

Chat généralRésuméExtraction de donnéesSupport clientTraduction

Points forts

  • Inférence ultra-rapide (~389 tokens/s) à moitié prix du Flash
  • Fenêtre de contexte de 1M tokens avec entrée multimodale complète (texte, image, vidéo, audio)
  • Solides connaissances générales (MMLU 88,9%) pour un modèle lite
  • Mode de réflexion intégré avec profondeur configurable

Limites

  • Modèle en preview — le comportement peut évoluer
  • Raisonnement complexe nettement plus faible que le Flash de base (HLE 16% vs 43,5%)
  • Performances médiocres en contexte long à 1M tokens (MRCR 12,3%)

Ressources

Ce modèle peut utiliser vos données pour l'entraînement

Modèles similaires