Модели /

Meituan: LongCat Flash Chat

Идентификатор модели

meituan/longcat-flash-chat

Характеристики

Контекстное окно
131K токенов
Провайдер
131072
Архитектура
text->text

Модальности

Входящие

  • text

Исходящие

  • text

Цены

Оплата по факту за использованные токены и операции. Цены в рублях (за 1 млн токенов или за единицу — как указано).

Тип Стоимость
Входящие токены 21.05 ₽ / 1M
Исходящие токены 84.20 ₽ / 1M
Чтение кэша 21.05 ₽ / 1M

Цены могут меняться в зависимости от курса валют. Данные по тарифам поступают от поставщика услуг и обновляются каждые сутки.

Описание

LongCat-Flash-Chat — крупномасштабная Mixture-of-Experts (MoE) модель с 560B параметрами, из которых 18.6B–31.3B (≈27B в среднем) динамически активируются на каждый вход. Модель представляет MoE-архитектуру с shortcut-соединениями для снижения коммуникационных накладных расходов и достижения высокой пропускной способности при сохранении стабильности обучения благодаря продвинутым стратегиям масштабирования, таким как перенос гиперпараметров, детерминированные вычисления и многоэтапная оптимизация.

Данный релиз, LongCat-Flash-Chat, представляет собой базовую модель без режима рассуждений, оптимизированную для разговорных и агентных задач. Поддерживает контекстные окна до 128K токенов и демонстрирует конкурентоспособную производительность в рассуждениях, кодировании, следовании инструкциям и предметных бенчмарках, с особыми преимуществами в использовании инструментов и сложных многошаговых взаимодействиях.

API и примеры кода

Единый API совместим с OpenAI SDK. Используйте ключ из личного кабинета.

main.py
from openai import OpenAI

client = OpenAI(
    base_url="https://routerapi.ru/api/v1",
    api_key="YOUR_API_KEY",
)

response = client.chat.completions.create(
    model="meituan/longcat-flash-chat",
    messages=[{"role": "user", "content": "Привет!"}],
)

print(response.choices[0].message.content)

Совместимо с OpenAI Python SDK, Node.js SDK, curl и любым HTTP-клиентом. Документация API · Все модели