Gemini 3.1 Flash Lite

GeminiCompact

RaisonnementOutilsVisionSortie structurée

À propos de ce modèle

Gemini 3.1 Flash Lite Preview is Google's high-efficiency model optimized for high-volume use cases. It outperforms Gemini 2.5 Flash Lite on overall quality and approaches Gemini 2.5 Flash performance across...

Catégorie de performance

Compact

Gemini 3.1 Flash Lite est un modèle compact de Gemini : petit, rapide et abordable, optimisé pour la vitesse et le coût.

Petit, rapide et économique. Optimisé pour la vitesse et le faible coût, idéal pour les tâches simples ou à fort volume.

Tarification

Ce modèle est inclus dans les plans Elosia

Abordable

Coût réduit. Adapté à un usage soutenu et aux interactions volumineuses.

Type	par 1M tokens
Entrée (prompt)	$0.250
Sortie (complétion)	$1.50
Image	$0.250
Raisonnement interne	$1.50
Lecture cache	$0.025
Écriture cache	$0.083

Capacités

Taille du contexte1.0M

Tokens de sortie max66K

TokenizerGemini

Entréetext, image, video, file, audio

Sortietext

Date de sortie3 mars 2026

Benchmarks

Intelligence générale

MMLU

88.9%

GPQA Diamond

86.9%

Mathématiques

MATH-500

Non reporté

Programmation

HumanEval

Non reporté

Raisonnement

Humanity's Last Exam

16%

Multimodalité

MMMU-Pro

76.8%

Usages recommandés

Chat généralRésuméExtraction de donnéesSupport clientTraduction

Points forts

Inférence ultra-rapide (~389 tokens/s) à moitié prix du Flash
Fenêtre de contexte de 1M tokens avec entrée multimodale complète (texte, image, vidéo, audio)
Solides connaissances générales (MMLU 88,9%) pour un modèle lite
Mode de réflexion intégré avec profondeur configurable

Limites

Modèle en preview — le comportement peut évoluer
Raisonnement complexe nettement plus faible que le Flash de base (HLE 16% vs 43,5%)
Performances médiocres en contexte long à 1M tokens (MRCR 12,3%)

Ressources

Documentation officielle model-card

Ce modèle peut utiliser vos données pour l'entraînement

Modèles similaires

Gemini

Gemini

Claude

Cohere