Gemini 3.1 Flash Lite Preview is Google's high-efficiency model optimized for high-volume use cases. It outperforms Gemini 2.5 Flash Lite on overall quality and approaches Gemini 2.5 Flash performance across key capabilities. Improvements span audio input/ASR, RAG snippet ranking, translation, data extraction, and code completion. Supports full thinking levels (minimal, low, medium, high) for fine-grained cost/performance trade-offs. Priced at half the cost of Gemini 3 Flash.
Catégorie de performance
Compact
Gemini 3.1 Flash Lite est un modèle compact de Gemini : petit, rapide et abordable, optimisé pour la vitesse et le coût.
Petit, rapide et économique. Optimisé pour la vitesse et le faible coût, idéal pour les tâches simples ou à fort volume.
Tarification
Ce modèle est inclus dans les plans Elosia
Type
par 1M tokens
Entrée (prompt)
$0.250
Sortie (complétion)
$1.50
Image
$0.250
Raisonnement interne
$1.50
Lecture cache
$0.025
Écriture cache
$0.083
Capacités
Taille du contexte1.0M
Tokens de sortie max66K
TokenizerGemini
Entréetext, image, video, file, audio
Sortietext
Date de sortie3 mars 2026
Benchmarks
Intelligence générale
MMLU
88.9%
GPQA Diamond
86.9%
Mathématiques
MATH-500
Non reporté
Programmation
HumanEval
Non reporté
Raisonnement
Humanity's Last Exam
16%
Multimodalité
MMMU-Pro
76.8%
Usages recommandés
Chat généralRésuméExtraction de donnéesSupport clientTraduction
Points forts
Inférence ultra-rapide (~389 tokens/s) à moitié prix du Flash
Fenêtre de contexte de 1M tokens avec entrée multimodale complète (texte, image, vidéo, audio)
Solides connaissances générales (MMLU 88,9%) pour un modèle lite
Mode de réflexion intégré avec profondeur configurable
Limites
Modèle en preview — le comportement peut évoluer
Raisonnement complexe nettement plus faible que le Flash de base (HLE 16% vs 43,5%)
Performances médiocres en contexte long à 1M tokens (MRCR 12,3%)