Chain-of-Verification (CoVe) — это техника, в которой модель сначала даёт ответ, затем выделяет проверяемые claims, формулирует к ним проверочные вопросы, отдельно перепроверяет их и только после этого выпускает исправленную финальную версию. В 2026 CoVe удобнее всего воспринимать как self-fact-check loop для factual и claim-heavy задач.
Вместо общей просьбы «проверь себя» модель сначала сама определяет, что именно в её ответе выглядит как факт и что надо проверить отдельно.
Общая инструкция "проверь себя" часто даёт слабый эффект, потому что модель не знает, что именно проверять и по какому критерию. CoVe делает проверку явной:
Сначала появляется draft answer.
Затем из него извлекаются потенциально рискованные claims.
Каждый claim проверяется отдельно.
Только потом создаётся revised answer.
Эта декомпозиция делает self-check более дисциплинированным.
На практике CoVe не столько "заставляет модель сомневаться", сколько организует второй проход как отдельный pipeline с понятными шагами.
Техника особенно хорошо раскрывается в grounded workflows:
retrieved context уже есть;
модель отвечает по контексту;
затем проверяет, действительно ли её claims поддержаны найденными документами.
Если retrieval плохой, CoVe не исправит фундаментальную проблему, но хотя бы чаще доведёт модель до честного "не подтверждено".
Если revised answer после CoVe часто ослабляет или удаляет claims, это не обязательно плохо. Это признак, что self-check действительно работает, а не просто повторяет исходный ответ.
У CoVe есть важное слабое место: он проверяет только те claims, которые сам заметил. Если модель не выделила рискованное утверждение на этапе claim extraction, дальше этот участок просто не попадёт в verification loop.
Типовые провалы:
заметные factual claims проверяются, а скрытая причинная интерпретация остаётся без проверки;
модель подтверждает себя тем же стилем рассуждения, что и в draft;
verification questions формулируются слишком общо и не привязаны к evidence.
Поэтому CoVe лучше всего работает там, где claims можно сделать явными и привязать к конкретному контексту, документу или tool result.
Если верификация идёт тем же расплывчатым стилем, что и исходный ответ, CoVe превращается в декоративный дополнительный шаг. Проверочные вопросы и verdict должны быть максимально конкретными.