RouterAPI Docs

Мониторинг и наблюдаемость

Документация RouterAPI помогает быстро понять, как работать с публичным API, кабинетом, RouterAPI Gateway и мультимодальными сценариями.

Публичная документация

Что отслеживать в продакшене

  • Баланс и лимиты — периодически опрашивайте GET /api/v1/key или GET /api/v1/credits и алертьте на низкий остаток до того, как клиенты получат 402.
  • Коды ответов — доля 401, 402, 403, 429 и 5xx по вашему приложению; всплески часто связаны с ключами, квотами или таймаутами upstream.
  • Латентность — время до первого токена при стриминге и полное время ответа для нестриминговых вызовов.
  • Идентификатор запроса — в ответах шлюза может присутствовать корреляционный идентификатор (например, в заголовках или теле в зависимости от клиента); сохраняйте его в логах приложения для разбора инцидентов вместе с model и длиной промпта.

Рекомендации по логированию

  • Логируйте модель, HTTP-статус, длительность, тип вызова (stream / non-stream), без полного текста промптов и ответов — чтобы не раздувать хранилище и не копить персональные данные без необходимости.
  • Ключи и заголовки Authorization в логах не пишите; при отладке маскируйте значение.

Связь с биллингом

После успешного ответа списание зависит от наличия usage в ответе upstream. Если в метриках видно много успешных 200, но расход не растёт, сверьтесь с разделом «Стриминг и биллинг» и «Устранение неполадок».

Дополнительно

Нужен следующий раздел?

Откройте обзор, dashboard, мультимодальность или технические сценарии API.