Chain-of-Note — это техника, в которой модель перед ответом делает короткие заметки по контексту: что в retrieved material важно, что сомнительно, что повторяется, а что похоже на шум. Это не полноценный длинный CoT, а компактный слой note-taking поверх noisy context.
В 2026 такая техника особенно полезна для RAG и long-context задач. Проблема часто не в отсутствии данных, а в том, что retrieved context слишком шумный. Chain-of-Note помогает модели сначала нормализовать контекст в короткие опорные заметки, а уже потом отвечать.
Когда модель получает длинный набор фрагментов, она часто делает одну из трёх ошибок:
Chain-of-Note вставляет перед ответом короткий этап сжатия контекста. Модель не решает задачу целиком, а делает минимальные заметки о релевантном содержании.
Это резко полезнее, чем сразу бросать весь retrieval в one-shot answer.
Summary хочет пересказать контекст.
Chain-of-Note хочет подготовить рабочее основание для ответа. Поэтому заметки обычно:
То есть это не красивый конспект, а рабочий черновик.
Подход особенно хорош для:
Если retrieval quality неидеален, Chain-of-Note часто даёт заметный выигрыш почти без сложной оркестрации.
Ключевой выигрыш Chain-of-Note в том, что модель не обязана "красиво пересказать всё". Она может оставить только operationally useful points:
Практически это важно потому, что summary часто маскирует конфликтующие данные под гладкий пересказ. Notes, наоборот, могут явно оставить напряжение в контексте и не делать вид, что всё согласовано.
Техника не заменяет хороший retrieval. Если в контексте нет нужной информации, note-taking не спасёт. Кроме того, если заметки делать слишком длинными, вы снова получите шум вместо полезного промежуточного состояния.
Ещё один риск: модель может сделать заметки слишком "интерпретирующими", а не evidence-oriented. Тогда вместо фильтра шума получится ранняя галлюцинация, которая потом закрепится в финальном ответе.
Оптимальный режим — короткие, task-aware notes. Их цель не пересказать всё, а подготовить опору для ответа.
Модели получили большие контексты, но проблема noisy evidence никуда не исчезла. Более длинное окно не гарантирует лучшего выбора фактов. Chain-of-Note полезен именно как дисциплина работы с контекстом: сначала рабочие заметки, потом ответ.
Для production это хороший low-cost stabilizer. Он не требует сложного multi-agent pipeline, но уже снижает риск, что ответ построится на случайном retrieved fragment.