Контекстное окно — это максимальный объём текста (измеряется в токенах), который языковая модель может «видеть» и обрабатывать за один запрос. Сюда входят и ваше сообщение, и ответ модели.
Представьте рабочий стол ограниченного размера: вы можете разложить на нём только определённое количество документов. Контекстное окно — это размер такого стола для модели:
| Модель | Контекстное окно |
|---|---|
| Claude Sonnet/Opus | 200 000 токенов |
| GPT-4o | 128 000 токенов |
| Gemini 1.5 Pro | 1 000 000 токенов |
| GigaChat Pro | 32 000 токенов |
Если ваш запрос и история переписки превышают контекстное окно, модель «забывает» самые ранние сообщения. Поэтому в длинных чатах модель может потерять контекст начала разговора.