Self-Refine

[object Object]

Self-Refine — это цикл generate -> critique -> revise, где модель сначала создаёт черновик, затем оценивает его недостатки и переписывает ответ с учётом собственной критики. В 2026 это один из самых практичных verification-паттернов для writing, code generation, explanations и structured analysis: первый ответ часто "достаточно хороший", но после осмысленной редактуры становится заметно сильнее.

Смысл техники не в том, чтобы заставить модель "думать ещё раз", а в том, чтобы разделить роли: сначала автор, потом редактор, потом финальный автор.

Почему техника работает

Single-pass generation часто страдает от типовых проблем:

ответ слишком общий;
модель забывает ограничение по длине;
пропускает один важный аспект;
плохо структурирует вывод;
пишет приемлемо, но не наилучшим образом.

Self-Refine полезен тем, что даёт модели второй шанс, но не в режиме "просто попробуй ещё раз", а через явную критику по критериям.

Главная сила техники в разделении ролей:

author генерирует draft;
critic ищет слабые места;
editor делает controlled revision.

Это заметно лучше, чем единая расплывчатая инструкция "улучши ответ", потому что она делает improvement targeted, а не косметическим.

Главный принцип: critique должен быть rubric-based

Плохой вариант:

"проверь и улучши ответ".

Хороший вариант:

"оцени ответ по критериям: factuality, clarity, missing assumptions, actionable next step, tone".

Чем конкретнее рамка критики, тем полезнее и стабильнее refinement.

Хорошая critique говорит не только "что плохо", но и "по какому критерию это плохо". Именно это делает revision управляемым.

Когда Self-Refine особенно полезен

Плюсы

Часто заметно улучшает ясность, структуру и completeness
Не требует отдельной judge-модели
Хорошо работает для writing и code revision
Просто встраивается в существующие пайплайны

Минусы

Увеличивает latency и token cost
Без явного rubric critique бывает поверхностной
Не гарантирует factual correctness
Слишком много итераций может вести к over-editing

Лучшие сценарии:

customer emails;
product memos;
code review comments;
docs rewriting;
SQL / code cleanup;
structured plans and summaries.

Где техника слабее

Self-Refine не лучший выбор, если:

проблема в нехватке знаний, а не в качестве формулировки;
ответ должен опираться на внешние данные -> нужен RAG или CoVe;
нужен строгий schema output -> нужен structured outputs;
ошибка не в самом тексте, а в underlying reasoning path -> лучше Factored Verification или Self-Consistency.

Проще говоря: Self-Refine отлично шлифует ответ, но плохо исправляет фундаментально неверную epistemic base.

Полезный production-паттерн

Обычно лучший режим — это не бесконечный refine-loop, а всего 1-2 прохода:

В большинстве практических систем один critique-pass уже даёт основную пользу. Третий и четвёртый проходы обычно приносят мало качества и много cost.

Примеры

Self-Refine для письма

ПромптGPT-5 mini

Напиши письмо клиенту о переносе релиза.

Потом оцени письмо по критериям: ясность, ответственность, отсутствие лишней обороны, конкретный next step.

Перепиши финальную версию.

Ответ модели

Финальная версия письма стала короче, убрала оправдания, добавила новую дату и следующий шаг по коммуникации.

Self-Refine для кода

ПромптClaude Sonnet 4.6

Шаг 1: предложи исправление race condition.
Шаг 2: сам проверь решение по критериям correctness, simplicity, side effects.
Шаг 3: перепиши исправленную версию.

Ответ модели

Во второй версии решение добавляет блокировку только на критический участок и не меняет внешний API функции.

Self-Refine для анализа

ПромптGemini 2.5 Flash

Сделай product memo. Затем покритикуй его по критериям: missing risks, unsupported assumptions, weak next step. Потом перепиши финальную версию.

Ответ модели

Итоговая версия явно разделяет подтверждённые выводы и гипотезы, добавляет риск retention и более конкретный эксперимент.

Anti-patterns

Частые ошибки:

Слишком общий critique prompt.
Слишком много refine-итераций.
Отсутствие stop rule.
Попытка через refinement исправить knowledge gap.
Переписывание удачного ответа просто ради "второго прохода".

Отдельный риск — over-editing. Модель начинает шлифовать стиль и теряет полезную конкретику, которая была в draft.

Как понять, что refine-pass действительно полезен

Self-Refine хорошо измеряется не по ощущению "текст стал глаже", а по более прикладным сигналам:

уменьшается число human edits после первого черновика;
растёт rubric score по clarity / completeness / actionability;
снижается доля missed constraints;
финальный ответ реже уходит на ручной rewrite.

Если после refine-pass ответы становятся только длиннее, но не уменьшают число правок, значит цикл либо плохо спроектирован, либо в этой задаче он просто не нужен.

Когда revision лучше отклонить

Иногда лучшая стратегия — сохранить draft и не принимать revised version. Это особенно важно, когда:

revision добавил неподтверждённые детали;
текст стал менее конкретным;
исчезли полезные ограничения или disclaimers;
стиль улучшился, но factual safety просела.

В production полезно сравнивать draft и revision отдельным lightweight judge или human spot-check. Self-Refine не обязан автоматически принимать вторую версию только потому, что она "финальная".

Техническая реализация

draft = model(task)
critique = model(
    "Оцени черновик по rubric: clarity, correctness, completeness, constraint adherence\n\n"
    + draft
)
revision = model(
    "Перепиши ответ с учётом критики ниже. Не теряй сильные части черновика.\n\n"
    + critique
)

Хороший critique prompt

critique_prompt = """
Оцени черновик по критериям:
1. factual correctness
2. missing key points
3. clarity
4. constraint adherence
5. actionability

Для каждого критерия:
- verdict
- issue
- concrete fix
"""

Чем более actionable critique, тем качественнее revision.

Stop rule

def should_refine_more(score_delta: float, iterations: int) -> bool:
    return score_delta > 0.05 and iterations < 2

Даже грубая stop logic лучше бесконечного "улучши ещё раз".

Что логировать

draft;
critique;
revised answer;
delta between versions;
human preference or evaluator score.

Это помогает понять, где refinement действительно работает, а где просто тратит токены.

Практические улучшения

задавайте явный rubric;
ограничивайте число refine-проходов;
храните draft и critique в traces для отладки;
на high-stakes задачах не полагайтесь только на self-critique, добавляйте внешний evaluator.
если revision идёт в прод, отдельно меряйте accept rate revised vs original.

Частая ошибка

Если критика слишком общая, модель часто переписывает текст ради переписывания: становится длиннее, но не лучше. Улучшение должно быть связано с проверяемыми критериями.

Проверьте себя

1. Что лежит в основе Self-Refine?

Generate -> critique -> revise Один проход без проверки Только внешний retrieval

2. Что делает технику заметно сильнее?

Явный rubric для критики Максимально высокий temperature Отсутствие ограничений

3. Где Self-Refine обычно слабее?

Когда проблема в нехватке знаний или нужен строгий schema output Когда есть текстовый черновик Когда нужен второй проход

Self-RAG

Self-Verification