Эмбеддинги — это способ представить текст в виде набора чисел (вектора), чтобы компьютер мог понимать смысловую близость между словами, фразами и документами.
Модель эмбеддингов превращает текст в длинный список чисел — вектор. Например, фраза «домашний кот» может превратиться в список из 1536 чисел. Ключевое свойство: тексты с похожим смыслом получают близкие векторы.
| Применение | Как работает |
|---|---|
| Семантический поиск | Ищет документы по смыслу, а не по точному совпадению слов |
| RAG (поиск по базе знаний) | Находит релевантные фрагменты для подачи в модель |
| Кластеризация | Группирует похожие тексты (отзывы, заявки, статьи) |
| Рекомендации | Предлагает похожий контент на основе близости векторов |
Если вы спросите поисковую систему «как починить кран», эмбеддинги помогут найти статьи с заголовком «ремонт смесителя» — потому что их векторы будут близки по смыслу, хотя слова совершенно разные.