Модели /

NVIDIA: Nemotron Nano 12B 2 VL (free)

Идентификатор модели

nvidia/nemotron-nano-12b-v2-vl:free

Характеристики

Контекстное окно
128K токенов
Провайдер
128000
Архитектура
text+image+video->text

Модальности

Входящие

  • image
  • text
  • video

Исходящие

  • text

Цены

Оплата по факту за использованные токены и операции. Цены в рублях (за 1 млн токенов или за единицу — как указано).

Тип Стоимость
Входящие токены 0.00 ₽ / 1M
Исходящие токены 0.00 ₽ / 1M

Цены могут меняться в зависимости от курса валют. Данные по тарифам поступают от поставщика услуг и обновляются каждые сутки.

Описание

NVIDIA Nemotron Nano 2 VL — открытая мультимодальная модель рассуждений с 12 миллиардами параметров, предназначенная для понимания видео и интеллектуальной обработки документов. Представляет гибридную архитектуру Transformer-Mamba, сочетающую точность уровня трансформеров с эффективным по памяти моделированием последовательностей Mamba для значительно более высокой пропускной способности и меньшей задержки.

Модель принимает на вход текст и многостраничные изображения документов, генерируя ответы на естественном языке. Обучена на высококачественных синтетических датасетах, курированных NVIDIA, оптимизированных для оптического распознавания символов, рассуждения по диаграммам и мультимодального понимания.

Nemotron Nano 2 VL достигает ведущих результатов на OCRBench v2 и набирает ≈ 74 в среднем по MMMU, MathVista, AI2D, OCRBench, OCR-Reasoning, ChartQA, DocVQA и Video-MME — превосходя предыдущие открытые VL-базелайны. С помощью Efficient Video Sampling (EVS) обрабатывает длинные видео при сниженной стоимости инференса.

Открытые веса, обучающие данные и рецепты дообучения выпущены под разрешительной лицензией NVIDIA Open License с поддержкой развёртывания через NeMo, NIM и основные среды выполнения инференса.

API и примеры кода

Единый API совместим с OpenAI SDK. Используйте ключ из личного кабинета.

main.py
from openai import OpenAI

client = OpenAI(
    base_url="https://routerapi.ru/api/v1",
    api_key="YOUR_API_KEY",
)

response = client.chat.completions.create(
    model="nvidia/nemotron-nano-12b-v2-vl:free",
    messages=[{"role": "user", "content": "Привет!"}],
)

print(response.choices[0].message.content)

Совместимо с OpenAI Python SDK, Node.js SDK, curl и любым HTTP-клиентом. Документация API · Все модели