Route policy drift в 2026 нужен потому, что routing policy почти всегда сложнее, чем кажется на старте. В доке написано одно: expensive model только для hard cases, degraded mode только при слабом retrieval, review path только для risky actions. Через месяц в проде реальное поведение уже другое: fallback включается чаще, один route quietly съехал на cheaper model, review path перегружен и его начинают обходить, а tenant exceptions меняют политику сильнее, чем baseline rules. Команда думает, что контролирует маршрутизацию, но фактически живёт в другой системе.
Проблема в том, что:
Но decision quality уже сдвинулась. Команда видит нормальный upper-level KPI, но не видит, что policy больше не соответствует исходному intent.
Например:
route_selected;fallback_triggered;review_required;review_skipped;model_override_applied;degraded_mode_entered.Именно эти события показывают, как routing реально живёт.
Типовые источники:
Сами по себе эти решения иногда разумны. Проблема в том, что они остаются жить дольше, чем планировалось.
Полезно хранить:
Тогда observed routing можно сравнивать не с прошлой неделей, а с исходным intent.
Смотрят только на config diff, а не на observed behavior.
Временный workaround становится нормой.
Нельзя понять, почему именно был выбран route.
Policy quietly съезжает в дешёвые tiers.
Когда очередь растёт, control path незаметно ослабевает.
Минимальный dashboard обычно включает: