RAG (Retrieval-Augmented Generation) — это подход, при котором языковая модель перед генерацией ответа ищет нужную информацию в подключённой базе знаний. Это позволяет модели отвечать точнее и опираться на актуальные данные.
RAG работает в два этапа:
| Проблема без RAG | Решение с RAG |
|---|---|
| Модель не знает ваши внутренние документы | Модель ищет ответ в вашей базе знаний |
| Информация модели устарела | База знаний обновляется в любой момент |
| Модель галлюцинирует | Ответ опирается на конкретные источники |
| Нельзя указать источник ответа | Можно показать, откуда взята информация |
Компания подключает RAG к своей документации. Сотрудник спрашивает: «Как оформить командировку?». Система находит релевантный раздел из внутреннего регламента и генерирует понятный ответ со ссылкой на документ.