Модели /

OpenAI: GPT-4o Audio

Идентификатор модели

openai/gpt-4o-audio-preview

Характеристики

Контекстное окно
128K токенов
Провайдер
128000
Архитектура
text+audio->text+audio

Модальности

Входящие

  • audio
  • text

Исходящие

  • text
  • audio

Цены

Оплата по факту за использованные токены и операции. Цены в рублях (за 1 млн токенов или за единицу — как указано).

Тип Стоимость
Входящие токены 263.12 ₽ / 1M
Исходящие токены 1,052.49 ₽ / 1M

Цены могут меняться в зависимости от курса валют. Данные по тарифам поступают от поставщика услуг и обновляются каждые сутки.

Описание

Модель gpt-4o-audio-preview добавляет поддержку аудиовходов в качестве промптов. Это расширение позволяет модели улавливать нюансы в аудиозаписях и повышать глубину создаваемого пользовательского опыта. Аудиовыходы в настоящее время не поддерживаются. Стоимость аудиотокенов: $40 за миллион входных и $80 за миллион выходных аудиотокенов.

API и примеры кода

Единый API совместим с OpenAI SDK. Используйте ключ из личного кабинета.

main.py
from openai import OpenAI

client = OpenAI(
    base_url="https://routerapi.ru/api/v1",
    api_key="YOUR_API_KEY",
)

response = client.chat.completions.create(
    model="openai/gpt-4o-audio-preview",
    messages=[{"role": "user", "content": "Привет!"}],
)

print(response.choices[0].message.content)

Совместимо с OpenAI Python SDK, Node.js SDK, curl и любым HTTP-клиентом. Документация API · Все модели

Генерация аудио

Модель поддерживает синтез речи. Отправьте текст и получите аудиофайл.

generate_audio.py
from openai import OpenAI
from pathlib import Path

client = OpenAI(
    base_url="https://routerapi.ru/api/v1",
    api_key="YOUR_API_KEY",
)

response = client.audio.speech.create(
    model="openai/gpt-4o-audio-preview",
    voice="alloy",
    input="Привет! Это пример генерации речи через API.",
)

Path("output.mp3").write_bytes(response.content)
print("Аудио сохранено в output.mp3")