Top-p (nucleus sampling) — это параметр генерации текста, который ограничивает выбор следующего слова только теми вариантами, чья суммарная вероятность не превышает заданного порога p.
Когда модель выбирает следующее слово, она рассматривает все возможные варианты и их вероятности. Top-p отсекает маловероятные варианты:
Допустим, модель предсказывает следующее слово после «Кошка сидела на»:
| Слово | Вероятность | Включено при top-p = 0.8 |
|---|---|---|
| окне | 45% | Да |
| крыше | 25% | Да |
| стуле | 15% | Включено (сумма = 85%) |
| заборе | 8% | Нет |
| луне | 4% | Нет |
При top-p = 0.8 модель выберет одно из первых трёх слов, а «заборе» и «луне» даже не будут рассматриваться.
Оба параметра управляют разнообразием, но по-разному. Обычно рекомендуется настраивать один из них, а второй оставлять по умолчанию. Например, OpenAI советует менять либо температуру, либо top-p, но не оба сразу.