OpenAI: GPT-4o Audio

Характеристики

Контекстное окно: 128K токенов
Провайдер: 128000
Архитектура: text+audio->text+audio

Модальности

Входящие

audio
text

Исходящие

text
audio

Цены

Оплата по факту за использованные токены и операции. Цены в рублях (за 1 млн токенов или за единицу — как указано).

Тип	Стоимость	Описание
Входящие токены	276.96 ₽ / 1M	Токены запроса и контекста, обработанные моделью
Исходящие токены	1,107.82 ₽ / 1M	Токены ответа, сгенерированные моделью

Цены могут меняться в зависимости от курса валют. Данные по тарифам поступают от поставщика услуг и обновляются каждые сутки.

Начать использовать

Описание

Модель gpt-4o-audio-preview добавляет поддержку аудиовходов в качестве промптов. Это расширение позволяет модели улавливать нюансы в аудиозаписях и повышать глубину создаваемого пользовательского опыта. Аудиовыходы в настоящее время не поддерживаются. Стоимость аудиотокенов: $40 за миллион входных и $80 за миллион выходных аудиотокенов.

API и примеры кода

Единый API совместим с OpenAI SDK. Используйте ключ из личного кабинета.

main.py

from openai import OpenAI

client = OpenAI(
    base_url="https://routerapi.ru/api/v1",
    api_key="YOUR_API_KEY",
)

response = client.chat.completions.create(
    model="openai/gpt-4o-audio-preview",
    messages=[{"role": "user", "content": "Привет!"}],
)

print(response.choices[0].message.content)

terminal

curl -X POST "https://routerapi.ru/api/v1/chat/completions" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "openai/gpt-4o-audio-preview",
    "messages": [
      {"role": "user", "content": "Привет!"}
    ]
  }'

request.php

<?php
declare(strict_types=1);

$response = (new \GuzzleHttp\Client())->post(
    'https://routerapi.ru/api/v1/chat/completions',
    [
        'headers' => [
            'Authorization' => 'Bearer YOUR_API_KEY',
            'Content-Type'  => 'application/json',
        ],
        'json' => [
            'model'    => 'openai/gpt-4o-audio-preview',
            'messages' => [
                ['role' => 'user', 'content' => 'Привет!'],
            ],
        ],
    ]
);

$data = json_decode((string) $response->getBody(), true);
echo $data['choices'][0]['message']['content'];

main.go

package main

import (
    "bytes"
    "encoding/json"
    "fmt"
    "io"
    "net/http"
)

func main() {
    body, _ := json.Marshal(map[string]any{
        "model": "openai/gpt-4o-audio-preview",
        "messages": []map[string]string{
            {"role": "user", "content": "Привет!"},
        },
    })

    req, _ := http.NewRequest("POST",
        "https://routerapi.ru/api/v1/chat/completions",
        bytes.NewReader(body))
    req.Header.Set("Authorization", "Bearer YOUR_API_KEY")
    req.Header.Set("Content-Type", "application/json")

    resp, _ := http.DefaultClient.Do(req)
    defer resp.Body.Close()

    var result map[string]any
    raw, _ := io.ReadAll(resp.Body)
    json.Unmarshal(raw, &result)

    choices := result["choices"].([]any)
    msg := choices[0].(map[string]any)["message"].(map[string]any)
    fmt.Println(msg["content"])
}

Совместимо с OpenAI Python SDK, Node.js SDK, curl и любым HTTP-клиентом. Документация API · Все модели

Генерация аудио

Модель поддерживает синтез речи. Отправьте текст и получите аудиофайл.

generate_audio.py

from openai import OpenAI
from pathlib import Path

client = OpenAI(
    base_url="https://routerapi.ru/api/v1",
    api_key="YOUR_API_KEY",
)

response = client.audio.speech.create(
    model="openai/gpt-4o-audio-preview",
    voice="alloy",
    input="Привет! Это пример генерации речи через API.",
)

Path("output.mp3").write_bytes(response.content)
print("Аудио сохранено в output.mp3")

terminal

curl -X POST "https://routerapi.ru/api/v1/audio/speech" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "openai/gpt-4o-audio-preview",
    "voice": "alloy",
    "input": "Привет! Это пример генерации речи через API."
  }' \
  --output output.mp3

generate_audio.php

<?php
declare(strict_types=1);

$response = (new \GuzzleHttp\Client())->post(
    'https://routerapi.ru/api/v1/audio/speech',
    [
        'headers' => [
            'Authorization' => 'Bearer YOUR_API_KEY',
            'Content-Type'  => 'application/json',
        ],
        'json' => [
            'model' => 'openai/gpt-4o-audio-preview',
            'voice' => 'alloy',
            'input' => 'Привет! Это пример генерации речи через API.',
        ],
    ]
);

file_put_contents('output.mp3', $response->getBody()->getContents());
echo 'Аудио сохранено в output.mp3';

main.go

package main

import (
    "bytes"
    "encoding/json"
    "fmt"
    "io"
    "net/http"
    "os"
)

func main() {
    body, _ := json.Marshal(map[string]any{
        "model": "openai/gpt-4o-audio-preview",
        "voice": "alloy",
        "input": "Привет! Это пример генерации речи через API.",
    })

    req, _ := http.NewRequest("POST",
        "https://routerapi.ru/api/v1/audio/speech",
        bytes.NewReader(body))
    req.Header.Set("Authorization", "Bearer YOUR_API_KEY")
    req.Header.Set("Content-Type", "application/json")

    resp, _ := http.DefaultClient.Do(req)
    defer resp.Body.Close()

    raw, _ := io.ReadAll(resp.Body)
    os.WriteFile("output.mp3", raw, 0644)
    fmt.Println("Аудио сохранено в output.mp3")
}