Self-Discover

[object Object]

Self-Discover — это техника, в которой модель не сразу решает задачу, а сначала выбирает, какая структура рассуждения ей вообще нужна. Проще говоря: сначала строится reasoning scaffold, потом этот scaffold заполняется под конкретный кейс. В 2026 Self-Discover удобно понимать как meta-reasoning template selection.

Иногда проблема не в ответе, а в том, что модель выбрала неправильный способ думать. Self-Discover пытается сначала подобрать правильный способ рассуждения, а уже потом решать задачу.

Почему техника интересна

Большинство reasoning prompts предполагают, что формат решения уже известен:

сначала шаги;
сначала план;
сначала аналогии;
сначала принципы.

Self-Discover говорит: а что если правильный scaffold зависит от задачи и должен выбираться динамически?

Именно это делает технику интересной: она оптимизирует не только answer, но и thinking structure.

Плюсы

Даёт более адаптивную reasoning structure
Полезен для задач, где один fixed template слаб
Хорошо стыкуется с orchestration и agent workflows
Создаёт явный scaffold, который можно логировать и оценивать

Минусы

Сложнее и дороже обычного CoT
Избыточен для простых задач
Качество зависит от списка reasoning modules
Мета-фаза может красиво выглядеть, но не давать реального gain

Где техника действительно полезна

open-ended analytical tasks;
strategy and decision support;
education и tutoring;
complex policy reasoning;
agent workflows, где нужен dynamic plan of thought.

Почему Self-Discover особенно интересен в mixed-task системах

Техника сильнее всего не на одном "сложном вопросе", а в системах, где под одним route живут разные типы reasoning:

иногда нужен decomposition;
иногда сравнение альтернатив;
иногда проверка допущений;
иногда risk review перед recommendation.

Если на все такие кейсы натянуть один fixed scaffold, часть задач будет решаться хорошо, а часть будет проваливаться именно на структуре. Self-Discover полезен как способ не угадывать template заранее, а выбирать его под запрос.

Где она слишком тяжёлая

Не стоит тащить Self-Discover в:

basic arithmetic;
short factual QA;
extraction and formatting;
задачи с already obvious solution template.

В этих случаях лучше simpler techniques.

Практическое правило простое: если вы уже знаете, какой reasoning pattern нужен, Self-Discover почти всегда избыточен. Он окупается только там, где выбор структуры сам по себе является частью задачи.

Хорошая mental model

Self-Discover особенно понятен, если думать о нём как о выборе из набора micro-strategies:

decomposition;
compare options;
check assumptions;
use principles;
assess risks;
synthesize final decision.

Техника сильна не потому, что модулей много, а потому что модель учится собирать нужный набор под конкретную задачу.

Что считать хорошим scaffold

Полезный scaffold:

меняет порядок мышления;
убирает пропуски важных проверок;
явно влияет на финальный answer;
достаточно короткий, чтобы не съедать весь reasoning budget.

Плохой scaffold:

повторяет wording вопроса;
перечисляет очевидные шаги без пользы;
не приводит к другой структуре решения;
одинаков для всех задач независимо от типа запроса.

Не давайте модели 20 рыхлых reasoning-модулей. Лучше короткий curated set из 5-8 хорошо различимых стратегий, иначе meta-phase становится шумной.

Сравнение с соседними техниками

Self-Discover

Сначала выбирает саму структуру thinking

Plan-and-Solve

Сразу строит конкретный plan execution

Self-Discover

Может включать разные модули, не только abstraction

Step-Back

Фокусируется именно на abstraction before solution

Self-Discover

Выбирает reasoning scaffold внутри ответа

DECOMP

Оркестрирует внешние handlers и workflow modules

Частые ошибки

Плохая версия Self-Discover — это просто красивый список reasoning-модулей без влияния на финальный answer. Если scaffold не меняет качество решения, техника превратилась в декоративную прелюдию.

Ещё частые проблемы:

слишком большой и размытый набор модулей;
modules overlap друг с другом;
scaffold не используется во второй фазе;
система не оценивает, даёт ли meta-phase measurable uplift.

Хорошая схема оценки

Для техники полезно сравнивать не только final accuracy, но и:

меняется ли выбранный scaffold от типа задачи;
какие modules реально коррелируют с более сильным answer;
где meta-phase только увеличивает latency;
сколько раз chosen structure потом действительно используется в reasoning trace.

Иначе легко получить красивый, но бессмысленный adaptive layer.

Проверьте себя

1. Что Self-Discover оптимизирует в первую очередь?

Выбор структуры рассуждения под задачу Скорость генерации Количество эмодзи в ответе

2. Когда Self-Discover обычно избыточен?

На простых задачах с очевидным шаблоном решения На сложных аналитических кейсах В decision-support сценариях

3. Какой риск у плохой реализации Self-Discover?

Scaffold будет декоративным и не повлияет на answer Модель станет быстрее Исчезнет need for evaluation

Self-Debug

Self-RAG

Self-Discover

Суть в двух словах

Почему техника интересна

Плюсы

Минусы

Где техника действительно полезна

Почему Self-Discover особенно интересен в mixed-task системах

Где она слишком тяжёлая

Хорошая mental model

Что считать хорошим scaffold

Сравнение с соседними техниками

Частые ошибки

Хорошая схема оценки

Техническая реализация

Базовый skeleton

Что важно инженерно

Хорошие use-cases для eval

Production anti-pattern

Проверьте себя