Модели /

NVIDIA: Nemotron 3 Super

Идентификатор модели

nvidia/nemotron-3-super-120b-a12b

Характеристики

Контекстное окно
262K токенов
Провайдер
262144
Архитектура
text->text

Модальности

Входящие

  • text

Исходящие

  • text

Цены

Оплата по факту за использованные токены и операции. Цены в рублях (за 1 млн токенов или за единицу — как указано).

Тип Стоимость
Входящие токены 10.52 ₽ / 1M
Исходящие токены 52.62 ₽ / 1M
Чтение кэша 10.52 ₽ / 1M

Цены могут меняться в зависимости от курса валют. Данные по тарифам поступают от поставщика услуг и обновляются каждые сутки.

Описание

NVIDIA Nemotron 3 Super — это открытая гибридная MoE-модель на 120B параметров, которая активирует лишь 12B параметров для максимальной вычислительной эффективности и точности в сложных мультиагентных приложениях. Построенная на гибридной архитектуре Mamba-Transformer Mixture-of-Experts с многотокенной предикцией (MTP), она обеспечивает более чем на 50% более высокую скорость генерации токенов по сравнению с ведущими открытыми моделями.

Модель поддерживает контекстное окно в 1M токенов для долгосрочной агентной согласованности, междокументного рассуждения и многошагового планирования задач. Latent MoE позволяет вызывать 4 экспертов по стоимости инференса одного, улучшая интеллект и обобщающую способность. Обучение с подкреплением в 10+ средах обеспечивает лидирующую точность на бенчмарках, включая AIME 2025, TerminalBench и SWE-Bench Verified.

Модель полностью открыта: веса, датасеты и рецепты доступны по лицензии NVIDIA Open License, что позволяет легко кастомизировать и безопасно разворачивать её где угодно — от рабочей станции до облака.

API и примеры кода

Единый API совместим с OpenAI SDK. Используйте ключ из личного кабинета.

main.py
from openai import OpenAI

client = OpenAI(
    base_url="https://routerapi.ru/api/v1",
    api_key="YOUR_API_KEY",
)

response = client.chat.completions.create(
    model="nvidia/nemotron-3-super-120b-a12b",
    messages=[{"role": "user", "content": "Привет!"}],
)

print(response.choices[0].message.content)

Совместимо с OpenAI Python SDK, Node.js SDK, curl и любым HTTP-клиентом. Документация API · Все модели