CRAG

Система увидела, что первые документы лишь частично отвечают на вопрос, отправила запрос в дополнительный search layer и уже после этого собрала более grounded answer.

Чем CRAG отличается от обычного RAG

Обычный RAG действует так:

retrieved docs считаются приемлемыми;

генерация идёт сразу по ним.

CRAG добавляет corrective layer:

оценить overall quality retrieval;

если нужно, доискать знания;

локально очистить шум;

только потом генерировать ответ.

Это переводит систему из режима blind consumption в режим controlled grounding.

Обычный RAG

Система принимает top-k документы как данность и отвечает даже тогда, когда retrieval слабый или нерелевантный.

CRAG

Система сначала проверяет качество retrieval и при низкой уверенности запускает corrective actions.

Когда техника особенно полезна

CRAG хорошо подходит для:

enterprise search с шумным корпусом;

RAG по свежим или неполным данным;

многодоменных баз знаний;

систем, где vector retrieval часто приносит near-miss документы;

workflows с запасным web search.

Если retrieval уже очень сильный и узкий по домену, CRAG может быть избыточным.

Ограничения

CRAG требует метрики или модели, которая умеет различать хороший и плохой retrieval. Если evaluator слабый, система либо слишком часто делает corrective loops, либо пропускает плохие документы дальше.

Кроме того, у техники почти всегда выше latency, чем у plain RAG.

Почему техника актуальна в 2026

Большинство production-RAG систем уже поняли, что главная причина ошибок находится раньше генерации. CRAG важен потому, что делает retrieval quality first-class signal, а не скрытой предпосылкой.

Это особенно ценно для систем с heterogeneous corpora, где стабильность поиска не гарантирована.

Коротко

Чем CRAG отличается от обычного RAG

Когда техника особенно полезна

Ограничения

Почему техника актуальна в 2026

Техническая реализация