Few-shot обучение (Few-shot Learning)

Способность языковой модели выполнять задачу на основе нескольких примеров, приведённых прямо в промпте, без дополнительного обучения.

Few-shot обучение — это способность языковой модели понять задачу и выполнить её правильно, если вы покажете ей несколько примеров прямо в тексте запроса. «Few-shot» буквально переводится как «несколько попыток».

Как это работает

Вместо длинного объяснения задачи вы просто показываете модели 2-5 примеров того, что хотите получить. Модель распознаёт паттерн и применяет его к новым данным:

Пример промпта:

Определи тональность отзыва.

Отзыв: "Отличный сервис, всё быстро привезли!"
Тональность: положительная

Отзыв: "Ждал посылку три недели, пришла мятая."
Тональность: отрицательная

Отзыв: "Товар как на картинке, нормальная упаковка."
Тональность:

Модель ответит «нейтральная», потому что поняла паттерн из примеров.

Сколько примеров нужно

КоличествоНазваниеКогда подходит
0Zero-shotПростые задачи, понятные без примеров
1-2One/Two-shotМодель нужен формат ответа
3-5Few-shotНестандартные или сложные задачи
10+Many-shotОчень специфические паттерны

Почему это работает

Большие языковые модели обучены на таком количестве текста, что способны улавливать закономерности из буквально нескольких примеров. Это одно из самых удивительных свойств LLM, которое делает их полезными без всякого дообучения.

Связанные термины

  • Zero-shot обучение — выполнение задачи вообще без примеров
  • Промпт-инженерия — область, частью которой является few-shot подход
  • Промпт — запрос, в котором размещаются примеры