Agent Stop Conditions в 2026: когда агент должен остановиться, а не пробовать ещё раз

Agent stop conditions в 2026: как задавать terminal states для planning, tool use и retries, чтобы агент не входил в бесконечные loops и не ухудшал ситуацию новой активностью.

Agent stop conditions в 2026 важны потому, что многие production-agent failures выглядят не как единичная ошибка, а как слишком долгое продолжение активности после того, как полезный путь уже закончился. Агент ещё раз перепроверяет, ещё раз вызывает tool, ещё раз пытается переписать план, хотя evidence уже не улучшается, budget исчерпан или risk profile вырос.

Stop condition — это правило, по которому агент должен закончить текущий run: вернуть результат, запросить человека, уйти в manual mode, сделать abstain или зафиксировать failure. Без таких правил агент склонен продолжать работу дольше, чем полезно.

Самый вредный anti-pattern - описывать stop condition только как max_steps. Лимит шагов нужен, но сам по себе он не понимает, улучшает ли агент ситуацию, повторяется ли ошибка и стал ли следующий шаг уже operationally unsafe.

1. Stop condition — это часть политики, а не только техники

В production полезно различать:

техническую невозможность продолжать;
бессмысленность продолжения;
опасность продолжения;
необходимость human escalation.

Эти четыре причины могут приводить к разным terminal states.

2. No-progress detection важнее, чем кажется

Самый частый loop-паттерн:

агент слегка переформулирует тот же запрос;
вызывает тот же tool с теми же аргументами;
получает тот же тип ошибки;
продолжает, потому что формальный max_steps ещё не достигнут.

Полезно отдельно отслеживать:

repeated tool signature;
unchanged evidence set;
repeated plan branch;
identical error class;
zero delta in confidence.

Если два-три последовательных шага не добавили новый usable signal, это уже сильный кандидат на stop condition, а не на ещё один retry.

3. Stop conditions должны быть связаны с risk tier

Для low-risk research agent можно терпеть больше exploration. Для:

external send;
code write;
money movement;
policy decision;
browser submit

правильнее останавливать run раньше, особенно если:

retrieval degraded;
tool outputs неполные;
approval path недоступен;
confidence падает.

4. Typed terminal states лучше, чем один общий failure

Полезные terminal states:

success;
needs_clarification;
needs_human_review;
abstain;
failed_safe;
budget_exhausted.

Так orchestration и product layer понимают, что делать дальше, а не видят только бинарное "получилось / не получилось".

runs stopped by no-progress rule;
repeated-tool-loop rate;
budget-exhausted rate by route;
average step count before safe stop;
incidents prevented by stop policy;
percent of risky runs ending in typed escalation instead of blind retry.

Плюсы

Stop conditions уменьшают бесполезные loops и runaway behavior
Risk-aware stopping делает агент безопаснее на sensitive маршрутах
Typed terminal states улучшают downstream orchestration
No-progress rules экономят latency, cost и operator attention

Минусы

Слишком строгие stop conditions могут урезать полезную exploration depth
Нужно уметь измерять progress, а не только шаги
Разные маршруты требуют разных terminal policies
Без trace-quality метрик stop policy быстро становится guesswork

Источники

Agent State Management в 2026: checkpoints, resumability и короткая память без хаоса

Agent-to-Agent Protocol (A2A)

Agent Stop Conditions в 2026: когда агент должен остановиться, а не пробовать ещё раз

Короткая версия

Что особенно важно

1. Stop condition — это часть политики, а не только техники

2. No-progress detection важнее, чем кажется

3. Stop conditions должны быть связаны с risk tier

4. Typed terminal states лучше, чем один общий failure

5. Что особенно часто ломают команды

Max-steps only

Retry without state analysis

No risk-aware stopping

One generic failure terminal

No trace-level metrics

6. Какие метрики полезны

Плюсы

Минусы

Пример stop policy

Простой no-progress sketch

Источники