Tool side-effect verification в 2026 нужен потому, что successful tool call не означает successful real-world outcome. Инструмент мог вернуть ok, но письмо не ушло, запись не сохранилась, флаг не применился, внешняя система откатила изменение, а агент уже считает задачу завершённой. Без side-effect verification pipeline слишком легко путает технический ответ API с фактическим изменением состояния мира.
200 OK или success=true достаточным подтверждением того, что нужный эффект действительно случился.Полезно различать:
Это сильно честнее, чем один бинарный success.
Например:
Там ложное ощущение completion особенно дорого.
Полезные варианты:
Главное — чтобы проверка действительно смотрела на эффект, а не повторяла тот же optimistic response.
Если проверить эффект нельзя сразу, полезно:
Иначе система выдаёт слишком сильный promise.
Ответ API подменяет проверку результата.
Никто не подтверждает новое состояние.
Verification не независима.
Пользователь видит финальный success слишком рано.
Система не знает, как жить с uncertainty.
Полезно считать: