Косинусное сходство — это математический способ измерить, насколько два текста близки по смыслу. Метрика сравнивает направления числовых векторов (эмбеддингов) двух текстов: чем ближе направления — тем больше сходство.
| Значение | Что означает | Пример |
|---|---|---|
| 1.0 | Идентичный смысл | «кот» и «кот» |
| 0.8–0.9 | Очень похожи | «кот» и «котёнок» |
| 0.5–0.7 | Есть связь | «кот» и «домашнее животное» |
| 0.0 | Не связаны | «кот» и «математика» |
| -1.0 | Противоположный смысл | Редко на практике |
Представьте, что вы и друг стоите в центре комнаты и указываете руками в каком-то направлении. Если вы указываете в одну сторону — ваши «мнения» совпадают (сходство близко к 1). Если в разные стороны — не совпадают (сходство близко к 0).