Selection-Inference — это простая, но сильная идея: не просить модель сразу решить задачу по всему контексту, а разделить процесс на два шага. Сначала она выбирает нужные факты, правила или фрагменты (selection), а уже потом строит вывод (inference) только на этой сжатой опоре.
В 2026 такой подход особенно полезен, потому что модели получают всё более длинный контекст, но длинный контекст сам по себе не гарантирует точность. Частая проблема не в том, что модель "не знает", а в том, что она делает вывод по шумной смеси из релевантного и нерелевантного.
Во многих multi-step задачах ошибка происходит раньше финального вывода. Модель подхватывает не тот факт, смешивает главное с второстепенным или начинает тащить в reasoning красивую, но лишнюю деталь.
Selection-Inference чинит именно это место:
selection отвечает за релевантность;inference отвечает за вывод.Такое разделение делает reasoning более проверяемым. Если финальный ответ неверен, можно быстро понять, проблема была в выборе основания или уже в самом выводе.
Подход хорошо работает для:
Это одна из самых полезных техник там, где "всё вроде есть в контексте", но ответ всё равно плавает.
Лучше не ограничиваться фразой "сначала выбери важное". Нужно явно разделить этапы.
RAG решает вопрос "что подтащить в контекст". Selection-Inference решает другой вопрос: "что из уже доступного контекста действительно использовать как основание".
Поэтому техника полезна даже после retrieval. Она работает как внутренний фильтр перед выводом.
Хороший production-паттерн:
Техника не волшебная.
Поэтому Selection-Inference особенно полезен там, где можно задать чёткий критерий релевантности: "выбери только условия, которые прямо влияют на решение".
Сегодня её лучше воспринимать не как музейный research-pattern, а как рабочий дизайн-принцип для LLM-приложений:
Именно это делает систему прозрачнее. Для команды гораздо легче спорить о selection, чем о длинном конечном рассуждении, где всё смешано.
Частые ошибки:
Если selection почти равен исходному контексту, техника не сработала. Её смысл именно в осмысленном сжатии.