Structured Reflection

[object Object]

Structured Reflection — это паттерн, в котором агент после неудачного шага делает не свободный self-talk, а короткую рефлексию по заданной схеме: что ожидалось, что пошло не так, какой сигнал ошибки виден, что изменить на следующем шаге.

В 2026 этот подход особенно важен для computer-use и browser agents. Там ошибка легко превращается в длинное бесполезное reasoning-бормотание. Structured Reflection дисциплинирует post-mortem и делает его пригодным для реального исправления поведения.

Свободная рефлексия агента часто длинная, расплывчатая и малооперационная. Структурированная рефлексия нужна, чтобы reflection помогала следующему действию, а не просто выглядела умно.

Коротко

Structured Reflection полезна там, где агент:

  • регулярно ошибается в среде;
  • получает observable feedback;
  • должен быстро адаптироваться;
  • не может позволить себе длинный chaotic retry loop.
ПромптClaude Sonnet 4.6
После неудачной попытки заполни reflection в формате:
- ожидание
- что произошло
- вероятная причина
- что менять на следующем шаге

Задача: агент не смог найти кнопку подтверждения в интерфейсе.
Ответ модели

Ожидание: кнопка подтверждения внизу формы. Что произошло: внизу формы только кнопка 'далее'. Причина: агент перепутал stepper navigation и final submit. Следующий шаг: пройти к последнему шагу мастера и искать submit там.

Техника полезна не ради красивой рефлексии, а ради более точного next action.

Чем structured reflection лучше свободной

Свободная reflection часто страдает от типовых проблем:

  • слишком длинная;
  • повторяет уже известное;
  • не выделяет actionable correction;
  • плохо пригодна для memory layer.

Structured Reflection исправляет это через шаблон. Агент должен ответить на конкретные вопросы:

  • что ожидал?;
  • что увидел?;
  • где mismatch?;
  • что сделать иначе?

Это резко повышает operational value reflection.

Свободная рефлексия
Агент пишет длинный абзац о том, что задача сложная, интерфейс запутанный и нужно попробовать снова.
Structured Reflection
Агент коротко фиксирует mismatch между ожиданием и observation, называет вероятную причину и формулирует точную корректировку для следующего шага.

Когда техника особенно полезна

Structured Reflection хорошо подходит для:

  • browser automation;
  • computer use;
  • step-by-step UI workflows;
  • debugging agents;
  • embodied tasks с понятным feedback signal.

Если среда даёт ясные observations и ошибки повторяются локально, техника почти всегда даёт value.

Ограничения

Техника не заменяет реальное улучшение perception или tools. Если агент не видит экран, не понимает DOM или не получает хороший feedback, даже лучшая reflection не спасёт.

Также structured reflection может стать слишком шаблонной. Если поля шаблона всегда одинаковы и не адаптируются к типу ошибки, агент начнёт писать ритуальные формулировки без пользы.

Почему техника актуальна в 2026

Современные agents всё чаще работают в UI-heavy средах. Там post-step correction критичнее, чем красивые long-form explanations. Structured Reflection полезна именно как control primitive для adaptive retry.

Это делает её важной не только для research demos, но и для реальных browser/computer agents.

Техническая реализация

type Reflection = {
  expected: string
  observed: string
  likelyCause: string
  nextChange: string
}

Практический совет: reflection лучше делать короткой и bounded. Если агент пишет полстраницы текста, это почти всегда сигнал, что reflection format слишком свободный.

Проверьте себя

1. Что делает Structured Reflection более полезной, чем свободный self-talk?

2. Где техника особенно уместна?

3. Главный anti-pattern здесь?