Модели /

Google: Gemini 3.1 Flash Lite Preview

Идентификатор модели

google/gemini-3.1-flash-lite-preview

Характеристики

Контекстное окно
1M токенов
Провайдер
1048576
Архитектура
text+image+file+audio+video->text

Модальности

Входящие

  • text
  • image
  • video
  • file
  • audio

Исходящие

  • text

Цены

Оплата по факту за использованные токены и операции. Цены в рублях (за 1 млн токенов или за единицу — как указано).

Тип Стоимость
Входящие токены 26.31 ₽ / 1M
Исходящие токены 157.87 ₽ / 1M
Токены рассуждения 157.87 ₽ / 1M
Чтение кэша 10.00 ₽ / 1M
Запись кэша 10.00 ₽ / 1M

Цены могут меняться в зависимости от курса валют. Данные по тарифам поступают от поставщика услуг и обновляются каждые сутки.

Описание

Gemini 3.1 Flash Lite Preview — высокоэффективная модель от Google, оптимизированная для высоконагруженных сценариев. Превосходит Gemini 2.5 Flash Lite по общему качеству и приближается к производительности Gemini 2.5 Flash по ключевым характеристикам. Улучшения охватывают аудиовход/ASR, ранжирование RAG-фрагментов, перевод, извлечение данных и дополнение кода. Поддерживает все уровни размышления (minimal, low, medium, high) для тонкой настройки баланса стоимости и производительности. Стоимость составляет половину цены Gemini 3 Flash.

API и примеры кода

Единый API совместим с OpenAI SDK. Используйте ключ из личного кабинета.

main.py
from openai import OpenAI

client = OpenAI(
    base_url="https://routerapi.ru/api/v1",
    api_key="YOUR_API_KEY",
)

response = client.chat.completions.create(
    model="google/gemini-3.1-flash-lite-preview",
    messages=[{"role": "user", "content": "Привет!"}],
)

print(response.choices[0].message.content)

Совместимо с OpenAI Python SDK, Node.js SDK, curl и любым HTTP-клиентом. Документация API · Все модели