Модели /

Google: Gemma 3n 2B (free)

Идентификатор модели

google/gemma-3n-e2b-it:free

Характеристики

Контекстное окно
8K токенов
Провайдер
8192
Архитектура
text->text

Модальности

Входящие

  • text

Исходящие

  • text

Цены

Оплата по факту за использованные токены и операции. Цены в рублях (за 1 млн токенов или за единицу — как указано).

Тип Стоимость
Входящие токены 0.00 ₽ / 1M
Исходящие токены 0.00 ₽ / 1M

Цены могут меняться в зависимости от курса валют. Данные по тарифам поступают от поставщика услуг и обновляются каждые сутки.

Описание

Gemma 3n E2B IT — мультимодальная модель, дообученная на инструкциях, разработанная Google DeepMind. Она спроектирована для эффективной работы с эффективным размером параметров 2B при использовании архитектуры на 6B. Построена на архитектуре MatFormer, поддерживает вложенные подмодели и модульную компоновку через фреймворк Mix-and-Match. Модели Gemma 3n оптимизированы для развёртывания на устройствах с ограниченными ресурсами и предлагают контекстную длину 32K токенов, а также высокую производительность в мультиязычных задачах и задачах рассуждения на распространённых бенчмарках. Данный вариант обучен на разнообразном корпусе, включающем код, математику, веб-данные и мультимодальные данные.

API и примеры кода

Единый API совместим с OpenAI SDK. Используйте ключ из личного кабинета.

main.py
from openai import OpenAI

client = OpenAI(
    base_url="https://routerapi.ru/api/v1",
    api_key="YOUR_API_KEY",
)

response = client.chat.completions.create(
    model="google/gemma-3n-e2b-it:free",
    messages=[{"role": "user", "content": "Привет!"}],
)

print(response.choices[0].message.content)

Совместимо с OpenAI Python SDK, Node.js SDK, curl и любым HTTP-клиентом. Документация API · Все модели