В 2026 архитектуры RAG полезно описывать не через старую лестницу naive -> advanced -> modular, а через операционные паттерны retrieval-систем. Главный вопрос уже не “насколько система продвинутая”, а какой retrieval flow нужен для конкретного типа вопросов, данных и SLA.
Поэтому современный RAG-ландшафт удобнее делить так:
2-step RAG как базовый predictable pipeline;retrieval-enhanced RAG с hybrid, reranking и multi-query;corrective/adaptive RAG, где retrieval сначала оценивается;agentic RAG, где orchestration решает, искать ли вообще и чем искать;graph-oriented RAG, где retrieval строится вокруг сущностей и связей;hosted retrieval, где часть retrieval layer уже даёт платформа.2-step pipeline, а не агент с пятью источниками, reflection-циклом и графовой индексацией.Базовая схема всё ещё выглядит так:
user question
-> retrieval
-> prompt/context assembly
-> grounded answer
Эта архитектура до сих пор хороша, потому что:
Важно только не путать “простая” с “примитивная”. Хороший 2-step RAG в 2026 уже обычно включает:
top-k discipline;no-answer;file_search или vector_store.Следующий слой сложности не в оркестрации, а в улучшении retrieval stage.
Сюда входят:
Именно этот слой чаще всего даёт наибольший прирост качества без полного перехода в agentic architecture.
Не все корпуса одинаково чистые. Иногда:
Тогда полезны corrective patterns:
I don't know.Такие архитектуры полезнее понимать как retrieval governance, а не как “магический новый тип RAG”.
Agentic RAG добавляет оркестрацию:
Это имеет смысл, когда вопрос:
Но для обычного FAQ agentic path часто только:
GraphRAG и соседние graph-based retrieval patterns полезны не потому, что “графы моднее”, а потому что они лучше отвечают на вопросы:
Такие архитектуры дороже в индексации и сложнее в support, поэтому оправданы только если users действительно задают synthesis-heavy questions.
В 2026 RAG уже не всегда означает самодельные embeddings + self-managed vector DB.
Есть hosted paths:
vector stores;file_search;Это меняет архитектурный выбор:
Поэтому “архитектура RAG” теперь включает и степень контроля над retrieval internals.
Вместо “naive / advanced / modular” полезнее думать так:
| Вопрос | Архитектурный ответ |
|---|---|
| Retrieval нужен почти всегда и поведение должно быть простым | 2-step RAG |
| Retrieval даёт не лучший recall | retrieval-enhanced |
| Retrieval quality сильно плавает | corrective / adaptive |
| Задачи действительно multi-step | agentic |
| Нужен обзор и работа со связями | graph-oriented |
| Не хочется поднимать infra | hosted retrieval |
Здоровый порядок обычно такой:
2-step baseline;hybrid/rerank/multi-query, если baseline слаб;corrective или agentic;GraphRAG только если появились corpus-level synthesis questions.Именно так архитектурный выбор остаётся инженерным, а не декоративным.