Degraded Mode Risk Budgets в 2026: сколько ослабления системы ещё допустимо, прежде чем нужно ужесточать режим

Degraded mode risk budgets в 2026: как задавать допустимый объём degraded behavior, чтобы продукт не жил слишком долго в ослабленном состоянии и не накапливал скрытый риск.

Degraded mode risk budgets в 2026 нужны потому, что degraded mode часто воспринимают слишком бинарно: либо "мы уже в нём", либо "всё нормально". На практике degraded behavior может накапливаться постепенно: больше fallback-ответов, меньше tool confirmation, больше manual overrides, выше доля low-trust outputs, длиннее review queue. Если у системы нет risk budget, она может формально ещё не считаться broken, но уже долго жить в режиме, где качество и безопасность заметно ниже нормы.

Risk budget — это допустимый объём degraded behavior за период или для конкретного flow. Когда бюджет исчерпан, система должна ужесточать routing, расширять review или сужать autonomy.

Самый вредный anti-pattern - считать degraded mode терпимым сколько угодно долго, пока нет явной катастрофы. Это постепенно нормализует слабые решения как новую обычную работу системы.

1. Budget должен отражать именно расход risk capacity

Полезные расходы бюджета:

fallback auto-show;
missing citations in sensitive flows;
tool confirmation misses;
manual override spikes;
low-trust output consumption.

Так degraded state измеряется не только через availability, но и через качество решений.

2. Budget должен быть разным по flows

Например:

low-risk FAQ может терпеть больше degraded responses;
customer-visible actions — меньше;
money or compliance flows — почти ноль;
internal draft workflows — умеренно больше.

Один общий бюджет скрывает реальную опасность.

Если продукт умеет терпеть degraded behavior только в одних сценариях, а budget считается агрегированно по всем сценариям, система почти наверняка недооценивает реальные риски.

3. Budget должен иметь consequence

После исчерпания бюджета полезно:

widen review coverage;
disable auto-actions;
tighten authority boundaries;
suppress weak fallback paths;
trigger incident or change freeze.

Без consequence budget превращается в красивый график.

4. Budget помогает выходить из "почти нормального" режима

Он показывает:

продукт ещё technically жив;
но degraded behavior уже слишком дорог;
нормализация слабых решений недопустима;
требуется либо remediation, либо stricter mode.

Это особенно полезно до полной деградации.

degraded budget burn rate;
percent of time over budget;
budget breaches by flow class;
actions disabled after budget breach;
review expansion caused by budget exhaustion;
recurrence of over-budget periods.

Плюсы

Risk budgets делают degraded mode измеримым и управляемым
Ловят накопление слабых решений до большого incident
Помогают различать acceptable degradation и dangerous normalization
Связывают quality erosion с routing actions

Минусы

Нужно определить, что именно считается расходом бюджета
Разные flows требуют разной tolerances
Слишком чувствительный budget может часто триггерить guardrails
Без хорошей observability расчёт будет неточным

Источники

Degraded Mode Exit Criteria в 2026: когда систему можно считать вышедшей из ослабленного режима

Degraded Mode Rollback Triggers в 2026: когда нужно быстро вернуть систему обратно в более строгий режим

Degraded Mode Risk Budgets в 2026: сколько ослабления системы ещё допустимо, прежде чем нужно ужесточать режим

Короткая версия

Что особенно важно

1. Budget должен отражать именно расход risk capacity

2. Budget должен быть разным по flows

3. Budget должен иметь consequence

4. Budget помогает выходить из "почти нормального" режима

5. Что особенно часто ломают команды

No budget, only incidents

One budget for all flows

Budget without action

Budget tracks uptime only

Chronic over-budget treated as normal

6. Какие метрики полезны

Плюсы

Минусы

Пример risk budget

Простой breach check

Источники