Policy as Code for Agents в 2026: когда правила должны жить в коде, а не только в prompt

Policy as code for agents в 2026: machine-enforced rules для tool calls, approvals, routing и output validation вместо одних текстовых инструкций.

Policy as code for agents в 2026 нужна потому, что текстовые инструкции полезны, но слабы там, где системе нужно обязательное, воспроизводимое и проверяемое ограничение. Как только речь заходит о tool permissions, approvals, output contracts, data access или unsafe side effects, policy должна перестать быть только prose и стать machine-enforced rule.

Иначе команда получает знакомую проблему: prompt говорит одно, а реальный runtime по факту всё ещё может сделать другое.

Policy as code означает, что важные правила формулируются не только словами для модели, но и как проверяемые условия в системе. Например, "нельзя отправлять внешнее письмо без approval" должно быть не рекомендацией в prompt, а правилом, которое код реально умеет заблокировать.

Самый опасный anti-pattern - считать system prompt единственным policy layer. Он может направлять поведение, но не даёт жёсткой гарантии для risky actions, tenant boundaries, approvals и output handling.

1. Prompt policy и runtime policy решают разные задачи

Полезно развести:

Prompt policy

направляет reasoning;
объясняет intent системы;
помогает модели выбирать корректное поведение.

Runtime policy

блокирует нежелательные действия;
проверяет контракты;
требует approval;
ограничивает доступ;
пишет audit trail.

Они должны дополнять друг друга, но authoritative layer для risky behavior почти всегда должен быть runtime.

какая версия правила сейчас активна;
какой rule triggered;
почему action был заблокирован или разрешён;
как policy менялась со временем.

Без этого policy-as-code быстро превращается в скрытый набор if/else без governance.

4. Deny-by-default особенно полезен для risky classes

Для dangerous actions полезно строить политику так:

по умолчанию запрещено;
разрешение выдаётся явно;
exception paths журналируются;
approval подтверждает override.

Так команда лучше контролирует blast radius и change risk.

5. Policy changes сами по себе являются production changes

Даже без деплоя новой модели policy change может:

расширить tool access;
снять approval;
изменить routing;
повысить exposure к данным;
увеличить false refusals.

Поэтому policy changes полезно сопровождать:

versioning;
staged rollout;
audit sample;
rollback path.

policy block rate;
approval-trigger rate;
false block / false allow audits;
policy version rollout metrics;
incidents correlated with policy changes;
percent of critical actions covered by enforced rules.

Плюсы

Policy as code делает критичные ограничения enforceable и audit-able
Deny-by-default полезен для risky tools и side effects
Versioned policies проще откатывать и анализировать после инцидента
Снижает зависимость от одного prompt как fragile control layer

Минусы

Появляется дополнительный governance layer, который тоже надо сопровождать
Слишком жёсткие rules могут ухудшать UX и automation coverage
Без объяснимости policy blocks раздражают operators и developers
Prompt/runtime drift всё равно нужно специально отслеживать

Источники

Policy Exception Handling в 2026: как обрабатывать исключения без тихого обхода guardrails

Prompt Caching в 2026: как реально экономить на повторяющемся контексте

Policy as Code for Agents в 2026: когда правила должны жить в коде, а не только в prompt

Короткая версия

Что особенно важно

1. Prompt policy и runtime policy решают разные задачи

Prompt policy

Runtime policy

2. Что особенно хорошо ложится в policy as code

Tool permissions

Approval gates

Output handling

Data access

Routing restrictions

3. Policy должна быть проверяемой и наблюдаемой

4. Deny-by-default особенно полезен для risky classes

5. Policy changes сами по себе являются production changes

6. Что особенно часто ломают команды

Prompt-only governance

Hidden policy rules in business code

No versioning

No explainability

Policy drift from prompt

7. Какие метрики полезны

Плюсы

Минусы

Пример policy rule

Простой enforcement hook

Источники