Inner Monologue

[object Object]

Inner Monologue переводит агент из open-loop planning в closed-loop режим. Вместо одного плана на старте система поддерживает внутренний текстовый state: что уже произошло, что не получилось, что изменилось в среде и что теперь делать дальше. Это очень важный паттерн для environments, где мир меняется во время исполнения.

В 2026 идея Inner Monologue полезна далеко не только в роботике. Любой агент, который делает tool calls, открывает страницы, получает ошибки и сталкивается с новыми наблюдениями, выигрывает от явного обновляемого reasoning state.

Inner Monologue делает reasoning не одноразовым планом, а живым текстовым состоянием, которое обновляется после каждого шага.

Коротко

Inner Monologue полезен, когда:

  • среда меняется по ходу задачи;
  • агент получает feedback после действий;
  • нужен closed-loop planning;
  • execution errors должны менять дальнейший план.
ПромптClaude Sonnet 4.6
После каждого действия обновляй внутренний state: что уже сделано, что пошло не так и что это меняет в плане. Не продолжай старый план вслепую.
Ответ модели

Система скорректировала дальнейшие шаги после того, как один tool call вернул пустой результат, вместо того чтобы продолжать по устаревшему сценарию.

Это техника про feedback-aware planning, а не просто про больше текста.

Чем Inner Monologue отличается от обычного плана

Обычный план часто выглядит так:

  • понять задачу;
  • расписать шаги;
  • исполнять их по очереди.

Inner Monologue добавляет постоянный loop:

  • выполнить действие;
  • получить observation;
  • обновить внутреннее описание мира;
  • перепланировать следующий шаг.

Это делает агента намного устойчивее в реальных условиях.

Open-loop plan
Система строит план один раз и плохо реагирует на изменения среды, ошибки или неожиданные наблюдения.
Inner Monologue
Система после каждого действия обновляет текстовый reasoning state и строит следующий шаг уже из нового контекста.

Когда техника особенно полезна

Inner Monologue хорошо подходит для:

  • browser agents;
  • robotics;
  • workflow agents с внешними API;
  • environments с uncertain observations;
  • задач, где успех зависит от промежуточной обратной связи.

Если execution полностью детерминирован и среда не меняется, выигрыш будет меньше.

Ограничения

Inner Monologue повышает стоимость и может раздувать внутреннее состояние. Без дисциплины state management агент начинает просто накапливать длинный текст без реальной пользы.

То есть техника эффективна только тогда, когда feedback реально влияет на policy следующего шага.

Почему техника актуальна в 2026

Современные agents всё чаще работают в средах, где наблюдения и ошибки приходят непрерывно. Поэтому идея "сделать план один раз" быстро ломается. Inner Monologue важен как шаг к более реалистичному execution-aware reasoning.

Это делает технику особенно ценной для любых nontrivial agents with feedback loops.

Техническая реализация

let monologue = initialState

for (const step of executionLoop) {
  const action = await model(nextActionPrompt(monologue))
  const observation = await act(action)
  monologue = await model(updateStatePrompt(monologue, action, observation))
}

Практический совет: храните state в компактной форме. Если Inner Monologue превращается в бесконтрольный transcript, стоимость растёт быстрее пользы.

Проверьте себя

1. Что является ядром Inner Monologue?

2. Когда Inner Monologue особенно полезен?

3. Главный риск Inner Monologue?