CRAG — Corrective RAG

CRAG в 2026: retrieval evaluation, corrective fallback, decompose-then-recompose и честная логика 'доверять найденному не всегда'.

CRAG в 2026 полезно понимать как corrective retrieval policy. Базовая мысль очень здравая: retrieved documents не надо принимать на веру. Система сначала оценивает, насколько retrieval действительно годится для ответа, и только потом решает, отвечать по найденному, очищать контекст, искать дополнительно или честно отказываться.

Это делает CRAG важной промежуточной ступенью между обычным 2-step RAG и более дорогими agent workflows.

Обычный RAG часто ведёт себя так: “что нашёл, по тому и отвечаю”. CRAG добавляет простую проверку: “а то, что мы нашли, вообще отвечает на вопрос?” Если нет, система не должна слепо продолжать.

CRAG не равен просто reranking. Reranker переупорядочивает кандидатов, а CRAG решает более жёсткий вопрос: достаточно ли retrieval вообще пригоден для ответа и нужен ли corrective path.

Состояние retrieval	Что делать
Good	отвечать по найденному
Mixed / partial	очистить и, возможно, дополнить
Bad	не доверять retrieval, идти в fallback или abstain

1. Какую проблему решает CRAG

Обычный RAG имеет опасный implicit assumption:

если retriever вернул top-k, значит по ним можно отвечать.

На практике это не так. Часто бывает:

найдено что-то похожее, но не то;
документы частично релевантны;
ответ есть только наполовину;
в базе ответа нет вовсе.

CRAG делает шаг назад и говорит: retrieval — это hypothesis, а не truth.

2. Что именно добавляет corrective layer

Минимально — evaluator, который определяет:

retrieval good enough;
retrieval partially useful;
retrieval insufficient / bad.

После этого уже можно запускать разные routes:

direct answer;
answer after context refinement;
fallback retrieval;
web search;
abstain / escalation.

Именно это делает CRAG operationally полезным: он не пытается быть “умным агентом”, но уже перестаёт быть слепым pipeline.

3. Decompose-then-recompose остаётся сильной идеей

Одна из полезных частей original CRAG — не просто оценить документ целиком, а разложить retrieved text на smaller knowledge units и собрать обратно только то, что реально относится к вопросу.

В 2026 эту идею можно понимать шире:

sentence-level filtering;
chunk compression;
quote extraction;
evidence-only context assembly.

То есть даже если вы не воспроизводите paper буквально, вы всё равно можете использовать CRAG-style context refinement.

4. CRAG — хороший ответ на unstable retrieval, но не на все проблемы

CRAG полезен, если беда в том, что retriever:

иногда приносит шум;
иногда приносит partial evidence;
иногда требует fallback.

Но он не заменяет:

хороший chunking;
hybrid retrieval;
reranking;
metadata filters;
access control.

Если baseline retrieval совсем слабый, corrective layer будет только часто говорить, что всё плохо.

5. Чем CRAG отличается от agentic RAG

CRAG:

проще;
дешевле;
локальнее в логике;
сфокусирован на “trust or don't trust retrieval”.

Agentic RAG:

шире в orchestration;
умеет работать с несколькими tools и sources;
лучше на multi-step задачах;
дороже в support.

Поэтому CRAG часто полезно использовать как первый upgrade после 2-step RAG, а не сразу прыгать в agentic systems.

6. Чем CRAG отличается от Self-RAG

Self-RAG встроен в trained model behavior.

CRAG чаще реализуется как внешний workflow:

retrieve;
evaluate;
correct;
answer.

Это делает CRAG проще для real-world adoption:

не требует специальной модели;
лучше дебажится;
легко добавляется поверх существующего retrieval stack.

Без техники

{ "title": "Слепой RAG", "content": "Retriever вернул похожие, но устаревшие документы. Модель отвечает по ним как будто они актуальны." }

С техникой

{ "title": "CRAG", "content": "Evaluator помечает retrieval как недостаточный и переводит систему либо в fallback path, либо в no-answer path." }

7. Как применять CRAG practically в 2026

Чаще всего в более простой форме, чем в paper:

retrieval quality classifier;
evidence sufficiency gate;
fallback retriever or web search;
answer suppression when evidence weak.

Такой corrective layer уже сильно улучшает trustworthiness production RAG без огромной orchestration complexity.

8. Где CRAG особенно оправдан

Хорошо работает в сценариях:

unstable corpora;
docs with stale pages;
internal KB + public docs combos;
systems, где cost of wrong answer выше cost of abstain.

Менее нужен там, где:

retrieval already high quality and stable;
все ответы живут в чистой curated базе;
latency budget очень жёсткий;
проще сразу честно переходить в no-answer.

Плюсы

Добавляет полезный trust gate между retrieval и generation
Снижает риск отвечать по плохому retrieval
Хорошо сочетается с fallback retrieval и web search
Проще внедряется, чем full agentic RAG

Минусы

Добавляет ещё один decision layer и latency
Не заменяет strong baseline retrieval
Требует настройки thresholds и fallback logic
Слишком агрессивный evaluator может резать полезный контекст

Минимальный corrective flow

question
-> retrieve top-k
-> evaluate retrieval quality
   -> good: answer
   -> partial: refine + optional fallback
   -> bad: fallback or abstain

Практически evaluator можно реализовать:

лёгким LLM grader;
cross-encoder plus threshold;
rule-based freshness / metadata checks;
комбинацией этих сигналов.

Проверьте себя

1. Что является ключевой идеей CRAG?

{ "text": "Retrieved context не надо принимать на веру, его нужно оценивать и при необходимости корректировать", "correct": true, "explanation": "Верно. Именно corrective layer делает CRAG полезным." } { "text": "Нужно всегда использовать только web search", "correct": false, "explanation": "Нет. Web search — только один из возможных fallback paths." } { "text": "Reranking полностью заменяет CRAG", "correct": false, "explanation": "Reranking и corrective gating решают разные задачи." }

2. Когда CRAG особенно полезен?

{ "text": "Когда retrieval иногда хороший, а иногда шумный или частичный", "correct": true, "explanation": "Да. Именно для unstable retrieval quality CRAG особенно полезен." } { "text": "Когда retrieval всегда идеален", "correct": false, "explanation": "Тогда corrective layer даёт меньше пользы." } { "text": "Только когда используется графовая база", "correct": false, "explanation": "CRAG не зависит от graph storage." }

3. Какой порядок обычно разумнее?

{ "text": "Сначала baseline retrieval, потом corrective layer", "correct": true, "explanation": "Да. CRAG не должен маскировать плохую основу." } { "text": "Сначала corrective layer, а retrieval можно не настраивать", "correct": false, "explanation": "Так система просто будет чаще говорить, что retrieval плохой." } { "text": "Сразу GraphRAG вместо CRAG", "correct": false, "explanation": "Это другой architectural choice." }

Источники

Agentic RAG — RAG с агентами

ColBERT и Late Interaction: точный поиск для RAG