Каждый инженер, который выкатывает в продакшен продукт на базе LLM, рано или поздно проходит через стадию отрезвления. На этапе разработки всё выглядит превосходно. Ты тщательно полируешь системный промпт, подкручиваешь параметры температуры, собираешь сложный RAG-пайплайн и прогоняешь набор подготовленных тестовых запросов. Нейросеть выдает блестящие, структурированные ответы. Дашборды показывают нормальные тайминги, автотесты светятся зеленым, и фича уезжает в релиз.