Progressive-Hint Prompting

[object Object]

Progressive-Hint Prompting, или PHP, это техника, в которой модель не просто пробует решить задачу ещё раз, а получает подсказку, построенную на основе предыдущей попытки. Подсказка не выдаёт весь ответ целиком, а мягко сдвигает reasoning в правильную сторону.

В 2026 это полезный middle ground между single-pass prompting и тяжёлым multi-agent pipeline. Если задача не решается с первого раза, но и полный orchestration с judge-model кажется избыточным, progressive hints часто дают хороший баланс.

Это похоже на преподавателя, который не говорит готовый ответ, а даёт следующую опору: "ты уже близко, проверь знак", "сначала найди общий объём", "ты забыл одно ограничение".

Коротко

PHP полезен, когда:

  • первый ответ модели почти правильный;
  • ошибка локальна;
  • можно дать полезный hint, не раскрывая всё решение.
ПромптGPT-5 mini
Реши задачу. Если ответ неуверенный, используй progressive hints:
1. попробуй сам;
2. затем получи hint вида 'сначала найди общий знаменатель';
3. реши заново с учётом hint.
Ответ модели

На первой попытке модель ошиблась в преобразовании дробей. После короткой подсказки 'приведи дроби к общему знаменателю до сравнения' решение стало корректным без полного раскрытия ответа.

Смысл техники не в том, чтобы сыпать подсказками бесконечно, а в том, чтобы давать минимально достаточный corrective signal.

Почему hints работают

Многие reasoning-ошибки у модели локальны:

  • пропущен один шаг;
  • выбрана неверная стратегия;
  • забыто одно условие;
  • reasoning path начался слишком рано.

В таких случаях полный restart с нуля часто избыточен. Более эффективно дать targeted hint, который перенаправит решение, но не сломает самостоятельный reasoning.

PHP строится именно вокруг этого.

Чем техника отличается от Self-Refine

Self-Refine просит модель критиковать и переписывать свой ответ.

Progressive-Hint Prompting чаще использует внешний или управляющий hint, который постепенно направляет новое решение.

То есть Self-Refine ближе к редактуре, а PHP — к guided retry.

Просто попробуй ещё раз
Модель второй раз повторяет ту же стратегию и часто делает ту же ошибку в другом месте.
Retry с hint
Модель получает маленькую, но содержательную подсказку, которая меняет траекторию reasoning, не раскрывая всё решение.

Когда техника особенно полезна

PHP хорошо работает для:

  • образовательных задач;
  • математики и логики;
  • tutor-пайплайнов;
  • assistive UIs, где нужен guided problem solving;
  • adaptive systems, где hint можно выбирать по типу ошибки.

Она слабее для factual QA без понятного reasoning path. Там скорее нужен retrieval или verification, а не hints.

Главный риск

Если hints слишком подробные, система перестаёт учить reasoning и просто подводит модель к ответу за руку. Если hints слишком абстрактные, пользы почти нет.

Хороший hint:

  • короткий;
  • связан с конкретной ошибкой;
  • помогает выбрать следующий шаг;
  • не раскрывает финальный answer.

Почему техника актуальна в 2026

Сейчас многие продукты строят адаптивные AI-интерфейсы: тьюторы, ассистенты, learning tools, support copilots. В таких интерфейсах важен не только правильный ответ, но и controlled help. Progressive-Hint Prompting идеально ложится на эту задачу.

Это also хороший эвристический слой перед более дорогим repair pipeline. Если один hint исправляет задачу, не нужно запускать сложную judge-orchestrator схему.

Техническая реализация

const attempt1 = await model(taskPrompt)
const hint = await hintGenerator(attempt1)
const attempt2 = await model(`${taskPrompt}\n\nПодсказка: ${hint}`)

Практический совет: полезно хранить hint taxonomy. Например: missing-constraint, bad-decomposition, arithmetic-slip, wrong-strategy. Это делает систему подсказок управляемой.

Проверьте себя

1. В чём основная идея Progressive-Hint Prompting?

2. Когда PHP особенно полезен?

3. Главный anti-pattern здесь?