Идентификатор модели
qwen/qwen3-vl-8b-thinking
Характеристики
- Контекстное окно
- 131K токенов
- Провайдер
- 131072
- Архитектура
- text+image->text
Модальности
Входящие
- image
- text
Исходящие
- text
Цены
Оплата по факту за использованные токены и операции. Цены в рублях (за 1 млн токенов или за единицу — как указано).
| Тип | Стоимость |
|---|---|
| Входящие токены | 12.31 ₽ / 1M |
| Исходящие токены | 143.66 ₽ / 1M |
Цены могут меняться в зависимости от курса валют. Данные по тарифам поступают от поставщика услуг и обновляются каждые сутки.
Описание
Qwen3-VL-8B-Thinking — вариант мультимодальной модели Qwen3-VL-8B, оптимизированный для рассуждений, предназначенный для продвинутых визуальных и текстовых рассуждений в сложных сценах, документах и временных последовательностях. Интегрирует улучшенное мультимодальное выравнивание и обработку длинного контекста (нативно 256K, расширяется до 1M токенов) для задач научного визуального анализа, каузального вывода и математического рассуждения по изображениям или видео.
По сравнению с Instruct-версией, Thinking-версия включает более глубокое визуально-языковое объединение и целенаправленные пути рассуждений, улучшающие производительность на задачах длинноцепочечной логики, решении задач STEM и многоэтапном понимании видео. Обеспечивает более сильную темпоральную привязку через Interleaved-MRoPE и эмбеддинги с учётом временных меток, сохраняя при этом надёжный OCR, мультиязычное понимание и генерацию текста на уровне крупных текстовых LLM.
API и примеры кода
Единый API совместим с OpenAI SDK. Используйте ключ из личного кабинета.
from openai import OpenAI
client = OpenAI(
base_url="https://routerapi.ru/api/v1",
api_key="YOUR_API_KEY",
)
response = client.chat.completions.create(
model="qwen/qwen3-vl-8b-thinking",
messages=[{"role": "user", "content": "Привет!"}],
)
print(response.choices[0].message.content)
Совместимо с OpenAI Python SDK, Node.js SDK, curl и любым HTTP-клиентом. Документация API · Все модели