Модели /

Inception: Mercury

Идентификатор модели

inception/mercury

Характеристики

Контекстное окно
128K токенов
Провайдер
128000
Архитектура
text->text

Модальности

Входящие

  • text

Исходящие

  • text

Цены

Оплата по факту за использованные токены и операции. Цены в рублях (за 1 млн токенов или за единицу — как указано).

Тип Стоимость
Входящие токены 26.31 ₽ / 1M
Исходящие токены 78.94 ₽ / 1M
Чтение кэша 10.00 ₽ / 1M

Цены могут меняться в зависимости от курса валют. Данные по тарифам поступают от поставщика услуг и обновляются каждые сутки.

Описание

Mercury — первая диффузионная большая языковая модель (dLLM). Благодаря прорывному подходу на основе дискретной диффузии модель работает в 5–10 раз быстрее даже оптимизированных по скорости моделей, таких как GPT-4.1 Nano и Claude 3.5 Haiku, при сопоставимой производительности. Скорость Mercury позволяет разработчикам создавать отзывчивые пользовательские интерфейсы, включая голосовых агентов, поисковые интерфейсы и чат-ботов. Подробнее в [блоге] (https://www.inceptionlabs.ai/blog/introducing-mercury).

API и примеры кода

Единый API совместим с OpenAI SDK. Используйте ключ из личного кабинета.

main.py
from openai import OpenAI

client = OpenAI(
    base_url="https://routerapi.ru/api/v1",
    api_key="YOUR_API_KEY",
)

response = client.chat.completions.create(
    model="inception/mercury",
    messages=[{"role": "user", "content": "Привет!"}],
)

print(response.choices[0].message.content)

Совместимо с OpenAI Python SDK, Node.js SDK, curl и любым HTTP-клиентом. Документация API · Все модели