Gemini

Gemini 2.5 Lite

GeminiCompact
RaisonnementOutilsVisionSortie structurée

À propos de ce modèle

Gemini 2.5 Flash-Lite is a lightweight reasoning model in the Gemini 2.5 family, optimized for ultra-low latency and cost efficiency. It offers improved throughput, faster token generation, and better performance across common benchmarks compared to earlier Flash models. By default, "thinking" (i.e. multi-pass reasoning) is disabled to prioritize speed, but developers can enable it via the [Reasoning API parameter](https://openrouter.ai/docs/use-cases/reasoning-tokens) to selectively trade off cost for intelligence.

Catégorie de performance

Compact

Gemini 2.5 Lite est un modèle compact de Gemini : petit, rapide et abordable, optimisé pour la vitesse et le coût.

Petit, rapide et économique. Optimisé pour la vitesse et le faible coût, idéal pour les tâches simples ou à fort volume.

Tarification

Ce modèle est inclus dans les plans Elosia
Typepar 1M tokens
Entrée (prompt)$0.100
Sortie (complétion)$0.400
Image$0.100
Raisonnement interne$0.400
Lecture cache$0.010
Écriture cache$0.083

Capacités

Taille du contexte1.0M
Tokens de sortie max66K
TokenizerGemini
Entréetext, image, file, audio, video
Sortietext
Date de sortie22 juillet 2025

Benchmarks

Intelligence générale
MMLU
78.5%
Mathématiques
MATH-500
72%
Programmation
HumanEval
68%

Usages recommandés

Chat généralRésuméSupport client

Points forts

  • Modèle Gemini le moins coûteux pour les applications à fort volume
  • Réponses ultra-rapides pour la classification et l'extraction
  • Efficace pour les tâches simples de conversation et de résumé

Limites

  • Capacités de raisonnement très limitées
  • Inadapté à la programmation complexe ou à l'analyse approfondie

Ressources

Ce modèle peut utiliser vos données pour l'entraînement

Modèles similaires