RAG (Retrieval-Augmented Generation)

Технология, при которой языковая модель сначала ищет релевантную информацию в базе знаний, а затем формирует ответ на её основе.

RAG (Retrieval-Augmented Generation) — это подход, при котором языковая модель перед генерацией ответа ищет нужную информацию в подключённой базе знаний. Это позволяет модели отвечать точнее и опираться на актуальные данные.

Как это работает

RAG работает в два этапа:

Поиск (Retrieval). Система ищет в базе знаний фрагменты документов, релевантные вопросу пользователя. Для этого используются эмбеддинги и векторный поиск.
Генерация (Generation). Найденные фрагменты подаются в модель вместе с вопросом, и модель формулирует ответ на основе этих данных.

Зачем нужен RAG

Проблема без RAG	Решение с RAG
Модель не знает ваши внутренние документы	Модель ищет ответ в вашей базе знаний
Информация модели устарела	База знаний обновляется в любой момент
Модель галлюцинирует	Ответ опирается на конкретные источники
Нельзя указать источник ответа	Можно показать, откуда взята информация

Пример из жизни

Компания подключает RAG к своей документации. Сотрудник спрашивает: «Как оформить командировку?». Система находит релевантный раздел из внутреннего регламента и генерирует понятный ответ со ссылкой на документ.

Связанные термины

Эмбеддинги — векторные представления текста, используемые для поиска в RAG
Векторная база данных — хранилище документов для RAG
Чанкинг — разбиение документов на фрагменты для индексации в RAG

Источники

Prompt Injection (инъекция в промпт)

RLHF (Обучение с подкреплением на основе обратной связи от людей)