Статьи по тегу: Боль "мусорных" данных

Анонс контекстного окна в 2 миллиона токенов вызвал в индустрии закономерную эйфорию. Разработчики с облегчением выдохнули: казалось, больше не нужно пилить сложные пайплайны векторизации, настраивать алгоритмы chunking'а и мучиться с гибридным поиском. Появился соблазн решить проблему контекста грубой силой. Берем весь репозиторий проекта, выгрузку из Jira за последние три года, гигабайты логов с продакшена, документацию в PDF и кидаем все это в один гигантский промпт. Пусть нейросеть сама…