Approval Policy Tuning в 2026: как не утонуть в unnecessary review и не открыть лишний риск

Approval policy tuning в 2026: где ужесточать review, где ослаблять, как считать false approvals и unnecessary human review в agent workflows.

Approval policy tuning в 2026 нужна потому, что первая версия review policy почти всегда либо слишком жёсткая, либо слишком мягкая. В одном случае система уходит в unnecessary human review и теряет throughput. В другом случае dangerous actions проходят слишком далеко без достаточного контроля. Поэтому approval layer нужно не просто включить, а регулярно настраивать как отдельную операционную систему риска.

Approval policy — это правила, какие действия агент может делать сам, а какие должен показать человеку. Tuning нужен, чтобы эта граница была не случайной, а соответствовала реальной цене ошибки и реальной нагрузке на reviewers.

Самый вредный anti-pattern - считать, что once-approved policy можно больше не трогать. Агентные workflows, модели, traffic mix и reviewer capacity меняются, а старая review граница быстро перестаёт соответствовать реальности.

1. Approval policy — это граница автоматизации

Её задача не просто "добавить человека", а ответить на вопрос:

где агент может действовать автономно;
где нужен review;
где нужен specialist escalation;
где лучше вообще manual-only path.

Поэтому tuning полезно строить вокруг trade-off:

safety;
throughput;
reviewer cost;
user latency.

2. Одни метрики review недостаточны

Полезно смотреть не только approve rate, но и:

сколько bad actions прошли;
сколько benign cases зря ушли человеку;
какие поля чаще всего редактируют;
какие кейсы reviewers почти всегда эскалируют;
где policy даёт много post-approval incidents.

Если policy меняется только на основе страха или только на основе queue pressure, она почти всегда смещается слишком далеко в одну сторону. Нужны одновременно risk и operations сигналы.

3. Edit-before-approve — один из лучших сигналов

Этот паттерн часто показывает:

packet неполный;
payload сырой;
threshold слишком строгий;
threshold слишком слабый;
agent consistently misses one operational detail.

Именно поэтому edit data полезно возвращать в:

packet design;
tool schema;
routing;
approval thresholds.

4. Тюнинг лучше делать по классам, а не глобально

Примеры полезной сегментации:

money movement by amount;
external communication by audience;
browser actions by domain;
support actions by policy sensitivity;
code actions by repo or branch type.

Так policy становится точнее и менее шумной.

5. Reviewer capacity тоже часть policy

Иногда policy technically правильная, но operationally невыгодная:

очередь слишком длинная;
reviewers часто спешат;
rising fatigue снижает quality;
urgent risky cases начинают ждать слишком долго.

Поэтому tuning должен учитывать:

available reviewer bandwidth;
SLA pressure;
current traffic shape.

false approval incidents;
unnecessary human review rate;
edit-before-approve rate;
post-approval incident rate;
review latency by risk class;
escalation acceptance / rejection patterns.

Плюсы

Policy tuning снижает и лишний human review, и незакрытый риск
Сегментация по action class делает approvals точнее
Edit and escalation data дают сильный feedback loop
Можно лучше согласовать safety с reviewer capacity

Минусы

Нужны хорошие review metrics и evidence quality
Слишком частые изменения policy могут запутать reviewers
Без calibration human layer сам становится шумным источником сигнала
Оптимальный баланс редко бывает стабильным надолго

Источники

Approval Packets в 2026: что именно показывать человеку перед risky action

Artifact Retention and Redaction в 2026: сколько хранить traces, screenshots и tool outputs

Approval Policy Tuning в 2026: как не утонуть в unnecessary review и не открыть лишний риск

Короткая версия

Что особенно важно

1. Approval policy — это граница автоматизации

2. Одни метрики review недостаточны

3. Edit-before-approve — один из лучших сигналов

4. Тюнинг лучше делать по классам, а не глобально

5. Reviewer capacity тоже часть policy

6. Что особенно часто ломают команды

One global threshold

No feedback from edits

Queue pressure ignored

Risk-only tuning

Ops-only tuning

7. Какие метрики полезны

Плюсы

Минусы

Пример policy buckets

Простой tuning question set

Источники