Tool Result Staleness в 2026: когда старый ответ инструмента уже нельзя использовать повторно

Tool result staleness в 2026: как задавать срок годности для результатов tools, retries и cached outputs, чтобы агент не принимал решения на устаревшем внешнем состоянии.

Tool result staleness в 2026 нужен потому, что агент любит переиспользовать уже полученные результаты: из retry state, из cache, из предыдущего шага, из replayed workflow. Это ускоряет систему и уменьшает cost, но только до того момента, пока tool result ещё описывает реальный мир. Старый CRM lookup, expired payment status или устаревший browser snapshot легко превращаются в ложное основание для следующего действия.

Tool result staleness — это правило, через сколько времени результат инструмента считается слишком старым для повторного использования.

Самый вредный anti-pattern - считать любой уже полученный tool output безопасным для reuse, если он лежит в state. Внешний мир меняется быстрее, чем агентный workflow.

1. Разные tools стареют с разной скоростью

Полезно различать:

static KB lookup;
CRM status;
billing snapshot;
browser DOM state;
rate limit info;
temporary auth or token state.

У каждого result-а свой realistic reuse window.

2. Retry state не должен скрывать stale external world

Частая ошибка:

агент сделал lookup;
потом были retries, delays, human pause;
финальный step использует старый result как будто он свежий.

Именно поэтому retries и resumes нужно связывать с freshness checks.

Если result поддерживает final action, лучше спрашивать не "у нас уже есть output?", а "достаточно ли он свежий для этого шага?".

3. Tool staleness должен быть route-aware

Один и тот же result может быть:

нормальным для summary;
уже слабым для recommendation;
недопустимым для execute.

Например, browser snapshot пятиминутной давности ещё полезен для explanation, но уже плох как support для click/submit.

4. Stale tool result должен влиять на orchestration

Полезные реакции:

force re-fetch;
downgrade to draft;
block risky commit;
request review;
rebuild evidence pack.

stale-tool-result usage rate;
forced refetch rate;
actions blocked by stale tool results;
average tool-result age at action time;
resume runs requiring revalidation;
incidents caused by reused stale outputs.

Плюсы

Staleness policy уменьшает решения на устаревшем внешнем состоянии
Делает retries и resumes безопаснее
Route-aware freshness улучшает action gating
Помогает различать cost-saving cache и unsafe reuse

Минусы

Нужно поддерживать TTL и revalidation rules по tool type
Forced refetch повышает latency и cost
Не всегда очевидно, какой freshness threshold достаточен
Без observability stale reuse трудно заметить

Источники

Tool Permission Reviews в 2026: как регулярно пересматривать, что агентам вообще разрешено

Tool Schema Design в 2026: как проектировать инструменты, чтобы агент не фантазировал

Tool Result Staleness в 2026: когда старый ответ инструмента уже нельзя использовать повторно

Короткая версия

Что особенно важно

1. Разные tools стареют с разной скоростью

2. Retry state не должен скрывать stale external world

3. Tool staleness должен быть route-aware

4. Stale tool result должен влиять на orchestration

5. Что особенно часто ломают команды

State means fresh enough

Same TTL for all tools

Retry without re-check

No distinction between read cache and action support

No stale telemetry

6. Какие метрики полезны

Плюсы

Минусы

Пример tool freshness policy

Простой stale check

Источники