RAG (Retrieval-Augmented Generation)

Технология, при которой языковая модель сначала ищет релевантную информацию в базе знаний, а затем формирует ответ на её основе.

RAG (Retrieval-Augmented Generation) — это подход, при котором языковая модель перед генерацией ответа ищет нужную информацию в подключённой базе знаний. Это позволяет модели отвечать точнее и опираться на актуальные данные.

Как это работает

RAG работает в два этапа:

  1. Поиск (Retrieval). Система ищет в базе знаний фрагменты документов, релевантные вопросу пользователя. Для этого используются эмбеддинги и векторный поиск.
  2. Генерация (Generation). Найденные фрагменты подаются в модель вместе с вопросом, и модель формулирует ответ на основе этих данных.

Зачем нужен RAG

Проблема без RAGРешение с RAG
Модель не знает ваши внутренние документыМодель ищет ответ в вашей базе знаний
Информация модели устарелаБаза знаний обновляется в любой момент
Модель галлюцинируетОтвет опирается на конкретные источники
Нельзя указать источник ответаМожно показать, откуда взята информация

Пример из жизни

Компания подключает RAG к своей документации. Сотрудник спрашивает: «Как оформить командировку?». Система находит релевантный раздел из внутреннего регламента и генерирует понятный ответ со ссылкой на документ.

Связанные термины

  • Эмбеддинги — векторные представления текста, используемые для поиска в RAG
  • Векторная база данных — хранилище документов для RAG
  • Чанкинг — разбиение документов на фрагменты для индексации в RAG