Идентификатор модели
google/gemini-2.5-flash-lite
Характеристики
- Контекстное окно
- 1M токенов
- Провайдер
- 1048576
- Архитектура
- text+image+file+audio+video->text
Модальности
Входящие
- text
- image
- file
- audio
- video
Исходящие
- text
Цены
Оплата по факту за использованные токены и операции. Цены в рублях (за 1 млн токенов или за единицу — как указано).
| Тип | Стоимость |
|---|---|
| Входящие токены | 10.52 ₽ / 1M |
| Исходящие токены | 42.10 ₽ / 1M |
| Токены рассуждения | 42.10 ₽ / 1M |
| Чтение кэша | 10.00 ₽ / 1M |
| Запись кэша | 10.00 ₽ / 1M |
Цены могут меняться в зависимости от курса валют. Данные по тарифам поступают от поставщика услуг и обновляются каждые сутки.
Описание
Gemini 2.5 Flash-Lite — облегчённая модель рассуждений семейства Gemini 2.5, оптимизированная для сверхнизкой задержки и экономичности. Обеспечивает улучшенную пропускную способность, более быструю генерацию токенов и лучшую производительность на общих бенчмарках по сравнению с предыдущими моделями Flash. По умолчанию «размышление» (т.е. многопроходное рассуждение) отключено для приоритета скорости, но разработчики могут включить его через параметр Reasoning API, выборочно жертвуя стоимостью ради интеллекта.
API и примеры кода
Единый API совместим с OpenAI SDK. Используйте ключ из личного кабинета.
from openai import OpenAI
client = OpenAI(
base_url="https://routerapi.ru/api/v1",
api_key="YOUR_API_KEY",
)
response = client.chat.completions.create(
model="google/gemini-2.5-flash-lite",
messages=[{"role": "user", "content": "Привет!"}],
)
print(response.choices[0].message.content)
Совместимо с OpenAI Python SDK, Node.js SDK, curl и любым HTTP-клиентом. Документация API · Все модели