Human-in-the-Loop для AI-агентов: approval, escalation и pause/resume

Human-in-the-loop в 2026: где ставить approval step, как проектировать review queue и почему pause/resume важнее полной автономии.

Human-in-the-loop в 2026 полезно понимать не как "человек иногда посмотрит ответ", а как control layer вокруг agent workflow. В зрелой системе вопрос не в том, есть ли человек вообще, а в том, где именно агент обязан остановиться, что показать оператору и как безопасно продолжить выполнение после решения человека.

Это особенно важно для агентных систем, где ошибка живёт не только в тексте ответа, но и в действии:

агент пишет во внешнюю систему;
меняет customer state;
отправляет письмо;
запускает workflow;
делает risky browser или computer-use step.

Human-in-the-loop не означает, что человек делает работу вместо агента. Это означает, что система умеет вовремя передать человеку решение там, где автоматизация без контроля уже слишком дорогая или опасная.

Если approval появляется только после того, как side effect уже произошёл, это не human-in-the-loop, а human-after-the-fact. Для risk control такой review почти бесполезен.

1. Где HITL действительно оправдан

Не every агентный workflow требует человека. Но есть зоны, где отсутствие human gate быстро становится operational problem.

Денежные и юридически значимые действия

refunds;
billing changes;
contract redlines;
policy exceptions;
compliance-sensitive approvals.

Действия с внешними побочными эффектами

email send;
CRM update;
browser/computer use;
ticket creation;
code execution;
запуск внешнего workflow.

Низкая уверенность и конфликт сигналов

Например:

retrieval и tool output противоречат друг другу;
agent plan выглядит plausible, но trace показывает repeated failures;
модель предлагает risky action на неполной информации;
policy layer и user intent расходятся.

2. Approval - не единственный режим

Практически полезно различать несколько human decisions:

Режим	Что означает
Approve	выполнить предложенное действие как есть
Reject	не выполнять и завершить или перестроить workflow
Edit	человек меняет payload, текст или параметры
Escalate	кейс уходит более опытному оператору
Take over	человек временно забирает управление на себя

Если система умеет только yes / no, она слишком быстро сталкивается с реальной операционной сложностью.

3. Как выглядит хороший approval packet

Самая частая ошибка - показать человеку либо весь trace, либо почти ничего.

Хороший approval packet обычно содержит:

proposed action;
affected entity;
краткое обоснование;
key evidence;
risk flags;
editable payload;
trace link для глубокого разбора.

То есть оператору нужен не весь внутренний reasoning, а минимум контекста, достаточный для решения.

Если human review занимает почти столько же времени, сколько ручное выполнение задачи, ваш HITL-path спроектирован слабо. Его задача - ускорять безопасное решение, а не дублировать ручной workflow.

4. Pause / resume важнее approval UI

Многие команды продумывают красивую кнопку approval, но не продумывают, как workflow продолжится после решения человека.

После approve или edit система должна:

знать, на каком step она была остановлена;
не повторить уже завершённые действия;
вернуть агенту точный human decision payload;
сохранить audit trail по всей цепочке.

Именно поэтому HITL почти всегда требует:

durable state;
step IDs;
явную границу proposed vs committed;
idempotent side effects.

Без этого один approval click легко приводит к duplicated action.

5. Что отправлять в review queue

Кроме очевидных high-risk actions, в human review часто полезно отправлять:

low-confidence final answers в high-stakes domain;
repeated tool failures;
policy disagreements;
out-of-distribution запросы;
long-running agents с нестабильной траекторией.

Это даёт не только safety, но и product signal:

где automation boundary ещё не готова;
какие кейсы надо покрыть eval-наборами;
где policy слишком жёсткая или, наоборот, дырявая.

6. Что ломает human-in-the-loop

Approval fatigue

Если в очередь уходит слишком много trivial решений, операторы начинают mechanically approve almost everything.

Late review

Человек видит уже committed action и ничего не контролирует.

Нет ownership model

Непонятно, кто отвечает за итог: агент, оператор первой линии или старший reviewer.

Нет audit-grade traces

Потом невозможно понять:

что предложил агент;
что изменил человек;
почему действие всё же было выполнено.

7. Какие метрики полезны

Минимальный HITL dashboard обычно включает:

approval rate;
reject rate;
edit-before-approve rate;
median time in review queue;
post-approval incident rate;
unnecessary-human-review rate;
escalation rate.

Отдельно полезно смотреть automation coverage with acceptable risk, а не просто процент кейсов "без человека".

Плюсы

Снижает риск на high-impact actions без отказа от автоматизации вообще
Даёт понятный escalation path для uncertain и exceptional кейсов
Создаёт качественный feedback loop для evals и product tuning
Делает agent behavior audit-able и управляемым

Минусы

Плохо спроектированная review queue убивает скорость
Approval fatigue быстро превращает контроль в формальность
Pause/resume требует хорошего state management
Без compact approval packet оператор тонет в traces

Пример approval payload

{
  "workflow_id": "wf_821",
  "step_id": "refund_proposal_3",
  "action": "issue_refund",
  "entity_id": "order_1842",
  "proposed_args": {
    "amount": 129.0,
    "reason": "duplicate_charge"
  },
  "risk_flags": ["money_movement", "policy_exception"],
  "evidence": [
    "billing tool shows duplicate transaction",
    "customer eligible under refund policy v7"
  ]
}

Минимальный pause / resume flow

def request_approval(workflow_id, step_id, payload):
    save_pending_decision(workflow_id, step_id, payload)
    return {"status": "paused", "awaiting": "human_review"}

def resume_after_human(decision):
    if decision["type"] == "reject":
        return {"status": "stopped"}
    if decision["type"] == "edit":
        return continue_workflow(with_payload=decision["edited_payload"])
    return continue_workflow(with_payload=decision["approved_payload"])

Практический совет: разделяйте plan, proposal и commit. Именно эта тройка обычно делает human decision воспроизводимым и не даёт workflow повторно прожимать already-approved side effects.

Проверьте себя

1. Когда human-in-the-loop особенно нужен?

Когда агент выполняет high-impact actions или работает при высокой цене ошибки Только в демонстрациях Только если модель совсем слабая

2. Почему approval после side effect часто бесполезен?

Потому что он уже не предотвращает риск, а лишь фиксирует его постфактум Потому что люди не умеют читать traces Потому что review queue всегда должна быть синхронной

3. Какой design choice особенно важен для pause/resume?

Durable state и ясная граница между proposed и committed action Максимально длинный chain-of-thought Одна общая кнопка `попробовать снова`

Источники

Human Review Ops в 2026: как строить review queue, SLA и качество операторов для AI-систем

Idempotency и Retries для AI-систем: как не дублировать side effects