Gemini

Gemini 3.1 Flash Lite

GeminiCompact
RaisonnementOutilsVisionSortie structurée

À propos de ce modèle

Gemini 3.1 Flash Lite Preview is Google's high-efficiency model optimized for high-volume use cases. It outperforms Gemini 2.5 Flash Lite on overall quality and approaches Gemini 2.5 Flash performance across key capabilities. Improvements span audio input/ASR, RAG snippet ranking, translation, data extraction, and code completion. Supports full thinking levels (minimal, low, medium, high) for fine-grained cost/performance trade-offs. Priced at half the cost of Gemini 3 Flash.

Catégorie de performance

Compact

Gemini 3.1 Flash Lite est un modèle compact de Gemini : petit, rapide et abordable, optimisé pour la vitesse et le coût.

Petit, rapide et économique. Optimisé pour la vitesse et le faible coût, idéal pour les tâches simples ou à fort volume.

Tarification

Ce modèle est inclus dans les plans Elosia
Typepar 1M tokens
Entrée (prompt)$0.250
Sortie (complétion)$1.50
Image$0.250
Raisonnement interne$1.50
Lecture cache$0.025
Écriture cache$0.083

Capacités

Taille du contexte1.0M
Tokens de sortie max66K
TokenizerGemini
Entréetext, image, video, file, audio
Sortietext
Date de sortie3 mars 2026

Benchmarks

Intelligence générale
MMLU
88.9%
GPQA Diamond
86.9%
Mathématiques
MATH-500
Non reporté
Programmation
HumanEval
Non reporté
Raisonnement
Humanity's Last Exam
16%
Multimodalité
MMMU-Pro
76.8%

Usages recommandés

Chat généralRésuméExtraction de donnéesSupport clientTraduction

Points forts

  • Inférence ultra-rapide (~389 tokens/s) à moitié prix du Flash
  • Fenêtre de contexte de 1M tokens avec entrée multimodale complète (texte, image, vidéo, audio)
  • Solides connaissances générales (MMLU 88,9%) pour un modèle lite
  • Mode de réflexion intégré avec profondeur configurable

Limites

  • Modèle en preview — le comportement peut évoluer
  • Raisonnement complexe nettement plus faible que le Flash de base (HLE 16% vs 43,5%)
  • Performances médiocres en contexte long à 1M tokens (MRCR 12,3%)

Ressources

Ce modèle peut utiliser vos données pour l'entraînement

Modèles similaires