Модели /

Cogito V2 Preview Llama 109B

Идентификатор модели

deepcogito/cogito-v2-preview-llama-109b-moe

Характеристики

Контекстное окно
33K токенов
Провайдер
32767
Архитектура
text+image->text

Модальности

Входящие

  • image
  • text

Исходящие

  • text

Цены

Оплата по факту за использованные токены и операции. Цены в рублях (за 1 млн токенов или за единицу — как указано).

Тип Стоимость
Входящие токены 18.94 ₽ / 1M
Исходящие токены 62.10 ₽ / 1M

Цены могут меняться в зависимости от курса валют. Данные по тарифам поступают от поставщика услуг и обновляются каждые сутки.

Описание

Instruct-дообученная гибридно-рассуждающая модель Mixture-of-Experts, построенная на Llama-4-Scout-17B-16E. Cogito v2 может отвечать напрямую или задействовать расширенную фазу «размышления», с выравниванием на основе Iterated Distillation & Amplification (IDA). Нацелена на программирование, STEM, следование инструкциям и общую полезность. Обладает более сильной мультиязычной производительностью, вызовом инструментов и рассуждением по сравнению с аналогами того же размера. Поддерживает длинные контексты (до 10M токенов) и стандартные рабочие процессы Transformers. Пользователи могут управлять поведением рассуждения с помощью булевого параметра reasoning enabled. Подробнее в документации

API и примеры кода

Единый API совместим с OpenAI SDK. Используйте ключ из личного кабинета.

main.py
from openai import OpenAI

client = OpenAI(
    base_url="https://routerapi.ru/api/v1",
    api_key="YOUR_API_KEY",
)

response = client.chat.completions.create(
    model="deepcogito/cogito-v2-preview-llama-109b-moe",
    messages=[{"role": "user", "content": "Привет!"}],
)

print(response.choices[0].message.content)

Совместимо с OpenAI Python SDK, Node.js SDK, curl и любым HTTP-клиентом. Документация API · Все модели