Чат-модель (Chat Model)

Языковая модель, обученная вести диалог в формате вопрос-ответ. ChatGPT и Claude — примеры чат-моделей.

Чат-модель — это языковая модель, специально обученная для ведения диалога. В отличие от базовых моделей дополнения, чат-модели понимают формат «вопрос — ответ» и могут поддерживать многоходовый разговор.

Как это работает

Базовая языковая модель просто продолжает текст. Чтобы превратить её в чат-модель, проводят дополнительное обучение:

  1. Instruction tuning — модель учат следовать инструкциям
  2. RLHF / RLAIF — модель учат давать полезные и безопасные ответы с помощью обратной связи от людей или другой AI-модели

После этого модель начинает работать с тремя типами сообщений: системные инструкции, сообщения пользователя и собственные ответы.

Сравнение: базовая модель vs чат-модель

ХарактеристикаБазовая модельЧат-модель
Что делаетПродолжает текстВедёт диалог
ВходПросто текстСистема сообщений
Следование инструкциямСлабоеХорошее
БезопасностьМинимальнаяВстроенные ограничения
ПримерыGPT-3 base, Llama baseChatGPT, Claude, GigaChat

Примеры чат-моделей

  • Claude (Anthropic) — Opus, Sonnet, Haiku
  • ChatGPT (OpenAI) — GPT-4o, o1, o3
  • GigaChat (Сбер) — доступен через API и веб-интерфейс

Связанные термины

  • Completion — базовый принцип генерации текста, на котором строятся чат-модели
  • Системный промпт — инструкция, задающая поведение чат-модели
  • RLHF — метод обучения, делающий модель диалоговой
  • Alignment — процесс обучения модели следовать правилам