Модели /

ByteDance: UI-TARS 7B

Идентификатор модели

bytedance/ui-tars-1.5-7b

Характеристики

Контекстное окно
128K токенов
Провайдер
128000
Архитектура
text+image->text

Модальности

Входящие

  • image
  • text

Исходящие

  • text

Цены

Оплата по факту за использованные токены и операции. Цены в рублях (за 1 млн токенов или за единицу — как указано).

Тип Стоимость
Входящие токены 10.52 ₽ / 1M
Исходящие токены 21.05 ₽ / 1M

Цены могут меняться в зависимости от курса валют. Данные по тарифам поступают от поставщика услуг и обновляются каждые сутки.

Описание

UI-TARS-1.5 — мультимодальный визуально-языковой агент, оптимизированный для GUI-сред: десктопных интерфейсов, веб-браузеров, мобильных систем и игр. Разработан ByteDance на основе фреймворка UI-TARS с рассуждением на базе обучения с подкреплением, обеспечивающим надёжное планирование и выполнение действий в виртуальных интерфейсах.

Модель достигает передовых результатов на ряде интерактивных бенчмарков и бенчмарков привязки, включая OSworld, WebVoyager, AndroidWorld и ScreenSpot. Также демонстрирует идеальное выполнение задач в разнообразных играх Poki и превосходит предыдущие модели в агентных задачах Minecraft. UI-TARS-1.5 поддерживает декомпозицию мыслей во время инференса и показывает сильное масштабирование между вариантами, при этом версия 1.5 заметно превосходит производительность более ранних контрольных точек 72B и 7B.

API и примеры кода

Единый API совместим с OpenAI SDK. Используйте ключ из личного кабинета.

main.py
from openai import OpenAI

client = OpenAI(
    base_url="https://routerapi.ru/api/v1",
    api_key="YOUR_API_KEY",
)

response = client.chat.completions.create(
    model="bytedance/ui-tars-1.5-7b",
    messages=[{"role": "user", "content": "Привет!"}],
)

print(response.choices[0].message.content)

Совместимо с OpenAI Python SDK, Node.js SDK, curl и любым HTTP-клиентом. Документация API · Все модели