Degraded Mode Exit Criteria в 2026: когда систему можно считать вышедшей из ослабленного режима
Degraded mode exit criteria в 2026: как задавать явные условия выхода из degraded mode, чтобы продукт не оставался в полубольном состоянии дольше нужного и не выходил из него слишком рано.
Degraded mode exit criteria в 2026 нужны потому, что для многих систем войти в degraded mode проще, чем выйти из него правильно. Tool path снова отвечает, latency вроде нормализовалась, часть alerts погасла, и команда спешит вернуть normal routing. Но если evidence quality, approval integrity, retrieval health или fallback rates ещё не восстановились, ранний выход только создаёт новую волну проблем. Обратная крайность тоже вредна: система остаётся в ограниченном режиме дольше, чем нужно, и тратит лишний человеческий ресурс.
Exit criteria — это явные условия, при которых продукт можно безопасно перевести из degraded mode обратно в normal mode.
Самый вредный anti-pattern - выходить из degraded mode по одному сигналу вроде "сервис снова отвечает". Для реального recovery обычно нужно несколько подтверждений сразу.
Они не должны автоматически считаться восстановленными вместе со всем остальным.
Если degraded mode вводился из-за риска для конкретного action class, выход из него должен подтверждаться именно на этом action class, а не только на общей метрике сервиса.
def can_exit_degraded(state):
return (
state["tool_health_ok"]
and state["quality_checks_ok"]
and state["stability_window_passed"]
)
Практический совет: хороший выход из degraded mode подтверждает не только "сервис ожил", но и "система снова принимает приемлемые решения на нужном уровне риска".
Проверьте себя
1. Почему availability сама по себе недостаточна для выхода из degraded mode?