Function Calling: Как мы научили нейросети…

Долгое время интеграция больших языковых моделей в реальные продукты напоминала попытки договориться с гениальным, но абсолютно непредсказуемым стажером. Мы просили: «Верни только JSON, без лишнего текста, ключи в snake_case». Стажер кивал и выдавал: «Конечно, вот ваш JSON: \\\json { .. } \\\ Удачи в использовании!».

Парсеры ломались. Регулярные выражения разрастались до неприличия. Разработчики писали многоэтажные костыли для очистки ответов от маркдауна и вежливых предисловий. Мы тратили часы на промпт-инжиниринг, пытаясь заставить текстовую модель вести себя как предсказуемый API. Появление JSON Mode немного сгладило углы, но не решило фундаментальную проблему: модель оставалась изолированным генератором текста, оторванным от внешнего мира.

Все изменилось с появлением Function Calling. Мы перестали уговаривать модель выдать правильный текст. Вместо этого мы дали ей строгий интерфейс.

Анатомия машинного интерфейса

Концепция Function Calling переворачивает паттерн взаимодействия. Мы заранее описываем доступные функции через строгие JSON-схемы и передаем их в массиве tools при каждом запросе. Нейросеть анализирует контекст беседы и, если понимает, что для ответа ей нужно выполнить действие, прекращает генерацию текста и возвращает структурированный запрос — tool_calls.

Рассмотрим пример интеграции с CRM-системой. Мы передаем модели описание функции создания задачи:

{
 "type": "function",
 "function": {
 "name": "create_crm_task",
 "description": "Создает новую задачу в CRM. Используйте, когда пользователь просит напомнить о звонке или встрече.",
 "parameters": {
 "type": "object",
 "properties": {
 "title": {
 "type": "string",
 "description": "Краткий заголовок задачи"
 },
 "due_date": {
 "type": "string",
 "description": "Дата выполнения в формате YYYY-MM-DD"
 },
 "priority": {
 "type": "string",
 "enum": ["low", "normal", "high"]
 }
 },
 "required": ["title", "due_date"]
 }
 }
}

Здесь кроется важный нюанс, отличающий работу с LLM от классического программирования. Поля description внутри параметров — это не просто документация для разработчика. Это микро-промпты для нейросети. Модель опирается на эти описания, чтобы правильно извлечь данные из неструктурированного пользовательского текста. Если пользователь пишет «Напомни звякнуть клиенту в следующую пятницу, это срочно», модель сама вычислит дату следующей пятницы, установит приоритет high и сформирует валидный JSON.

Жизненный цикл вызова

Когда модель решает использовать инструмент, она возвращает ответ, где поле content пустое (или содержит промежуточные рассуждения), а массив tool_calls заполнен:

"tool_calls": [
 {
 "id": "call_abc123",
 "type": "function",
 "function": {
 "name": "create_crm_task",
 "arguments": "{\"title\":\"Позвонить клиенту\",\"due_date\":\"2026-06-19\",\"priority\":\"high\"}"
 }
 }
]

Ваш бэкенд перехватывает этот вызов. Модель ничего не знает о вашей базе данных и не делает HTTP-запросов сама. Она лишь говорит: «Я хочу, чтобы ты выполнил эту функцию с такими аргументами». Бэкенд парсит arguments, выполняет реальный запрос к API CRM, получает результат (например, ID созданной задачи) и отправляет его обратно в модель новым сообщением с ролью tool.

Только получив контекст выполнения функции, модель формирует финальный человекочитаемый ответ: «Я создала срочную задачу на 19 июня. Номер задачи: #4512».

Стриминг и боль фрагментированного JSON

В теории все выглядит гладко. На практике разработчики сталкиваются с суровой реальностью потоковой передачи данных (Server-Sent Events). В режиме стриминга tool_calls приходят не цельным блоком, а разрываются на десятки мелких чанков.

Сначала приходит ID вызова. Затем имя функции. Затем открывающая фигурная скобка аргументов. Токены сыплются по одному: {"ti, tle":, "Поз. Клиентский код должен аккуратно буферизовать эти дельты, склеивать их в единую строку и только в самом конце, получив сигнал завершения, парсить итоговый JSON. Ошибка в склейке чанков приводит к падению парсера и потере контекста.

Отдельного упоминания заслуживает параллельный вызов функций (Parallel Function Calling). Когда пользователь просит «Сравни погоду в Москве и Токио», современные модели не вызывают функцию узнавания погоды дважды последовательно. Они возвращают массив из двух независимых tool_calls в одном ответе. Бэкенд выполняет оба запроса асинхронно и возвращает два результата с ролью tool.

Унификация зоопарка моделей через RouterAPI

В нашем шлюзе RouterAPI мы столкнулись с проблемой фрагментации рынка. Разные провайдеры реализуют поддержку инструментов по-своему. OpenAI задал стандарт, но Anthropic (Claude) использует собственный формат tools и tool_choice. Локальные опенсорс-модели часто путают структуру, вставляют маркдаун прямо внутрь JSON-аргументов или пытаются вызвать функции, которых нет в схеме.

Мы построили слой нормализации на стороне шлюза. RouterAPI принимает от клиента стандартный payload в формате OpenAI. Если запрос маршрутизируется на модель Claude, шлюз на лету транслирует JSON Schema в формат Anthropic.

Более того, мы взяли на себя самую сложную часть — нормализацию стриминга. Независимо от того, как сильно провайдер дробит токены или в каком порядке отдает метаданные вызова, RouterAPI собирает дельты, обрабатывает параллельные потоки (гарантируя, что индексы чанков не перемешиваются) и проксирует их клиенту в строгом соответствии со спецификацией OpenAI. Клиентские библиотеки работают с любыми моделями через наш шлюз без единой ошибки парсинга.

Безопасность и защита от галлюцинаций

Передача управления нейросети требует параноидального подхода к безопасности. Модели галлюцинируют. Даже самая умная нейросеть может придумать несуществующий параметр, проигнорировать обязательное поле required или попытаться передать SQL-инъекцию в строковом аргументе.

Мы выработали жесткое правило: никогда не доверять arguments, полученным от модели. Бэкенд обязан валидировать входящий JSON по той же схеме, что передавалась модели. Если валидация падает, мы не прерываем сессию. Мы отправляем модели сообщение с ролью tool, где вместо результата выполнения функции передаем текст ошибки валидации. Нейросети отлично понимают свои ошибки и в следующем tool_calls обычно присылают исправленный JSON.

Function Calling превратил языковые модели из умных генераторов текста в ядро автономных систем. Они получили руки. А благодаря унификации через RouterAPI, разработчикам больше не нужно переписывать логику вызовов при смене провайдера. Достаточно один раз описать бизнес-логику в JSON-схеме, и шлюз заставит любую совместимую нейросеть нажимать нужные кнопки в вашем продукте.

Function Calling: Как мы научили нейросети нажимать кнопки

Анатомия машинного интерфейса

Жизненный цикл вызова

Стриминг и боль фрагментированного JSON

Унификация зоопарка моделей через RouterAPI

Безопасность и защита от галлюцинаций

Теги

Ещё по теме