Evidence Freshness Policies в 2026: когда старое доказательство уже нельзя считать достаточным

Evidence freshness policies в 2026: как задавать сроки годности для citations, retrieval items и tool confirmations, чтобы decision и answer quality не опирались на устаревший evidence.

Evidence freshness policies в 2026 нужны потому, что одно и то же доказательство имеет разную "срок годности" в зависимости от контекста. Политика возвратов месячной давности может быть нормальным reference. Остаток на счёте пятиминутной давности — уже подозрителен. Screenshot из браузера час назад может быть useless для текущего action. Если система не различает свежесть evidence, она начинает одинаково верить слишком разным по актуальности опорам.

Freshness policy — это правило, насколько свежим должен быть источник, citation или tool confirmation для конкретного типа ответа или действия. Это не просто timestamp, а operational threshold.

Самый вредный anti-pattern - считать любое evidence допустимым, если оно "вообще существует". Для production систем stale evidence часто опаснее полного отсутствия evidence, потому что создаёт ложную уверенность.

1. Свежесть зависит от типа evidence

Полезно различать:

policy document;
knowledge-base article;
tool confirmation;
browser screenshot;
external web result;
human note.

У каждого типа своя operational актуальность.

2. Freshness должен зависеть от decision context

Один и тот же источник может быть:

достаточно свежим для explanation;
недостаточно свежим для action;
достаточным для low-risk summary;
недостаточным для compliance-sensitive answer.

Не спрашивайте "источник свежий или нет" в вакууме. Спрашивайте "достаточно ли он свежий для этого решения".

3. Stale evidence должен менять system behavior

Например:

trigger re-retrieval;
force new tool lookup;
downgrade confidence;
disallow commit action;
require human review.

Если stale status только рисуется в UI, но не влияет на routing, policy почти не работает.

4. Freshness полезно связывать с provenance

Команде важно знать:

кто отвечает за обновление evidence source;
когда источник последний раз проверяли;
stale он из-за ingest lag или из-за owner neglect;
есть ли более свежий alternative path.

Так freshness policy помогает не только answer quality, но и content operations.

stale-evidence usage rate;
forced re-check rate;
actions blocked by freshness policy;
freshness violations by source type;
average evidence age by route;
incidents tied to stale support.

Плюсы

Freshness policy уменьшает решения на устаревшем evidence
Type-aware thresholds делают governance реалистичнее
Связка freshness и routing повышает reliability
Полезно для RAG, tools и human review одновременно

Минусы

Нужно отдельно поддерживать thresholds по source type и route
Слишком строгая freshness policy может повышать latency и cost
Без provenance трудно понять причину stale evidence
Команды часто недооценивают operational значение timestamps

Источники

Evals 2.0: новое поколение оценки LLM-приложений

Evidence Pack Design в 2026: как собирать decision-ready набор доказательств для человека и автоматики

Evidence Freshness Policies в 2026: когда старое доказательство уже нельзя считать достаточным

Короткая версия

Что особенно важно

1. Свежесть зависит от типа evidence

2. Freshness должен зависеть от decision context

3. Stale evidence должен менять system behavior

4. Freshness полезно связывать с provenance

5. Что особенно часто ломают команды

One TTL for everything

Stale only as label

No forced re-check

Timestamp without semantics

No distinction between answer and action

6. Какие метрики полезны

Плюсы

Минусы

Пример freshness policy

Простой freshness check

Источники