Agentic RAG — RAG с агентами

Agentic RAG в 2026: routing, multi-step retrieval, tools, stop criteria и human gates для сложных вопросов, а не upgrade для любого FAQ-бота.

Agentic RAG в 2026 полезно понимать не как “RAG, но с модным агентом”, а как retrieval orchestration layer. Система уже не обязана делать один fixed search step: она может решить, нужен ли retrieval вообще, каким инструментом искать, нужно ли повторить запрос, достаточно ли найденного и пора ли останавливать цикл.

Главная practical разница с обычным 2-step RAG такая: agentic system управляет не только ответом, но и процессом добычи знаний.

Обычный RAG похож на сотрудника, который по любой задаче открывает одну и ту же папку и ищет там ответ. Agentic RAG больше похож на исследователя: он сначала решает, куда вообще смотреть, может открыть несколько источников, проверить себя и только потом сформировать ответ.

Agentic RAG не нужен автоматически всем. Если ваши вопросы одношаговые, хорошо покрываются knowledge base и требуют низкой задержки, агентная orchestration чаще ухудшает economics и debugability.

Способность	Что меняется
Routing	выбирает источник: KB, web, SQL, API
Multi-step retrieval	делает несколько итераций поиска
Tool use	комбинирует retrieval и вычисления
Reflection	оценивает, хватает ли данных
Stop criteria	прекращает цикл, когда answer ready

1. Чем agentic RAG отличается от обычного RAG

2-step RAG выглядит так:

question -> retrieve -> answer

Agentic RAG выглядит ближе к такому циклу:

question
-> decide whether to retrieve
-> choose source/tool
-> retrieve or call tool
-> inspect result
-> continue or stop
-> answer

Ключевой сдвиг в том, что retrieval становится управляемой серией решений, а не фиксированным шагом конвейера.

2. Routing важнее, чем “автономность”

На практике самый полезный агентный слой часто не в том, что система “думает как человек”, а в том, что она умеет правильно маршрутизировать запросы.

Например:

company policy question -> internal KB;
свежий рыночный факт -> web search;
user account question -> CRM / SQL / API;
вычисление -> calculator / code tool;
простой общий вопрос -> direct answer without retrieval.

Это уже сильный upgrade относительно схемы “любой запрос всегда идёт только в vector search”.

3. Multi-step retrieval нужен не так часто, но иногда решает всё

Есть вопросы, которые нельзя закрыть одним retrieval call:

compare X and Y across multiple docs;
find source, then verify freshness;
собрать answer из нескольких systems;
сначала найти сущность, потом дочитать детали;
сначала найти policy, потом проверить exception.

Именно здесь agentic RAG выигрывает у обычного pipeline. Он может:

сделать первый retrieval;
понять, чего не хватает;
сформировать следующий sub-query;
добрать недостающий контекст;
остановиться только когда coverage достаточен.

4. Tool use делает retrieval частью workflow, а не единственным инструментом

Практический агентный RAG редко ограничивается одной retrieval function.

Обычно рядом появляются:

file_search;
web_search;
SQL / database queries;
CRM or ticketing APIs;
calculator / code execution;
knowledge-specific MCP tools.

Это важно, потому что часть вопросов требует не “найти текст”, а:

посчитать;
сверить;
вызвать внутренний сервис;
собрать данные из structured и unstructured sources.

5. Stop criteria и budgets — обязательная часть

Agentic retrieval легко выходит из-под контроля, если не задать рамки.

Практически всегда нужны:

max number of search steps;
max web calls;
timeout budget;
token / cost budget;
explicit “insufficient evidence” exit.

Без этого agentic RAG превращается в дорогой loop, который делает вид, что “исследует”, а на деле просто повторяет похожие запросы.

Без техники

{ "title": "Плохо", "content": "Агент без ограничений продолжает переформулировать запросы и ходить в retrieval, пока не исчерпает токены." }

С техникой

{ "title": "Лучше", "content": "Агент имеет budgets, stop conditions и честный fallback: либо answer with evidence, либо explicit escalation." }

6. Agentic RAG не отменяет обычный retrieval quality

Частая ошибка: думать, что агент спасёт плохой retrieval stack.

Если:

chunking слабый;
filters broken;
hybrid search не настроен;
reranking отсутствует;
индекс грязный,

то агент просто будет много раз ходить в плохой retrieval.

Поэтому normal order такой:

сначала довести baseline retrieval;
потом добавлять orchestration.

7. Где agentic RAG действительно силён

Особенно хорош в сценариях:

research assistants;
deep support triage;
enterprise copilots with multiple systems;
due diligence / audit / ops flows;
workflows с обязательной проверкой источников и next-step decisions.

Хуже всего оправдан для:

простого docs QA;
маленького FAQ;
сценариев со строгим low-latency SLA;
задач, где ответ почти всегда есть в одном документе.

8. Хороший agentic RAG в 2026 — это workflow, а не свободный хаос

Anthropic, LangChain и OpenAI-паттерны сходятся в одном: самые полезные агентные системы обычно не полностью открытые, а имеют понятный workflow:

router;
retriever(s);
evaluator;
optional web lookup;
synthesis step;
final answer.

То есть practical agentic RAG ближе к structured workflow with decisions, чем к “полностью автономному исследователю”.

Плюсы

Позволяет решать multi-step и cross-source retrieval задачи
Даёт routing между KB, web, APIs и structured data
Позволяет проверять достаточность данных до финального ответа
Лучше подходит для сложных enterprise workflows, чем fixed 2-step RAG

Минусы

Увеличивает latency, cost и сложность eval/debug
Не спасает слабый baseline retrieval
Требует budgets, stop criteria и guardrails
Для обычного docs QA часто избыточен

Минимальный workflow

from openai import OpenAI

client = OpenAI()

tools = [
    {
        "type": "file_search",
        "vector_store_ids": ["vs_internal_docs"],
    },
    {
        "type": "web_search_preview",
    },
]

response = client.responses.create(
    model="gpt-5-mini",
    input="Сравни внутреннюю политику возвратов с публичной FAQ и отметь расхождения.",
    tools=tools,
)

Но production-grade version обычно оборачивает это в workflow с:

route classifier;
per-tool budgets;
answer verification;
escalation path;
traces.

Проверьте себя

1. Что в agentic RAG является самым важным практическим сдвигом?

{ "text": "Retrieval становится управляемой серией решений, а не одним фиксированным шагом", "correct": true, "explanation": "Верно. Именно orchestration отличает agentic RAG от обычного 2-step pipeline." } { "text": "Модель всегда обязана ходить во все доступные источники", "correct": false, "explanation": "Нет. Хороший агент как раз умеет не делать лишних шагов." } { "text": "Agentic RAG автоматически лучше любого обычного RAG", "correct": false, "explanation": "Это неверно. Для простых задач он часто избыточен." }

2. Когда agentic RAG особенно оправдан?

{ "text": "Когда задача требует нескольких источников, tools и нескольких retrieval steps", "correct": true, "explanation": "Да. Это основной класс задач, где agentic orchestration даёт реальную пользу." } { "text": "Когда есть маленький FAQ на 20 страниц", "correct": false, "explanation": "В таком случае обычно достаточно 2-step RAG." } { "text": "Когда не хочется настраивать budgets и stop criteria", "correct": false, "explanation": "Наоборот, агентный workflow особенно нуждается в ограничителях." }

3. Что произойдёт, если добавить agent loop поверх плохого retrieval?

{ "text": "Система будет много раз ходить в плохой retrieval", "correct": true, "explanation": "Именно так. Агент не заменяет quality retrieval stack." } { "text": "Агент автоматически исправит chunking и ranking", "correct": false, "explanation": "Нет. Эти проблемы нужно решать отдельно." } { "text": "Hybrid search и reranking становятся не нужны", "correct": false, "explanation": "Они остаются важными и в agentic systems." }

Источники

CRAG — Corrective RAG