Human-in-the-Loop для AI-агентов: approval, escalation и pause/resume
Human-in-the-loop в 2026: где ставить approval step, как проектировать review queue и почему pause/resume важнее полной автономии.
Human-in-the-loop в 2026 полезно понимать не как "человек иногда посмотрит ответ", а как control layer вокруг agent workflow. В зрелой системе вопрос не в том, есть ли человек вообще, а в том, где именно агент обязан остановиться, что показать оператору и как безопасно продолжить выполнение после решения человека.
Это особенно важно для агентных систем, где ошибка живёт не только в тексте ответа, но и в действии:
агент пишет во внешнюю систему;
меняет customer state;
отправляет письмо;
запускает workflow;
делает risky browser или computer-use step.
Human-in-the-loop не означает, что человек делает работу вместо агента. Это означает, что система умеет вовремя передать человеку решение там, где автоматизация без контроля уже слишком дорогая или опасная.
Если approval появляется только после того, как side effect уже произошёл, это не human-in-the-loop, а human-after-the-fact. Для risk control такой review почти бесполезен.
Агент сам проводит refund, публикует сообщение или меняет CRM-запись, а человек потом получает incident report.
С техникой
Агент собирает evidence, формирует proposed action и ставит workflow на pause до human decision. Только после approval происходит commit.
ПромптApproval intuition
Когда approval step должен стоять - до tool call или после?
Ответ модели
Если tool call уже может менять внешний мир, approval нужен до side effect. Постфактум review полезен только для auditing, но не для предотвращения риска.
Самая частая ошибка - показать человеку либо весь trace, либо почти ничего.
Хороший approval packet обычно содержит:
proposed action;
affected entity;
краткое обоснование;
key evidence;
risk flags;
editable payload;
trace link для глубокого разбора.
То есть оператору нужен не весь внутренний reasoning, а минимум контекста, достаточный для решения.
Если human review занимает почти столько же времени, сколько ручное выполнение задачи, ваш HITL-path спроектирован слабо. Его задача - ускорять безопасное решение, а не дублировать ручной workflow.
Практический совет: разделяйте plan, proposal и commit. Именно эта тройка обычно делает human decision воспроизводимым и не даёт workflow повторно прожимать already-approved side effects.
Проверьте себя
1. Когда human-in-the-loop особенно нужен?
2. Почему approval после side effect часто бесполезен?
3. Какой design choice особенно важен для pause/resume?