System 2 Attention (S2A)

[object Object]

System 2 Attention, или S2A, — это двухшаговый паттерн: сначала отделить полезные факты от шума, opinions и biasing cues, а потом отвечать уже на очищенном входе. В 2026 эту технику удобно понимать как lightweight preprocessing для случаев, где проблема не в reasoning-способностях модели, а в том, что вход перегружен мусором или подталкивает к поспешному выводу.

Иногда модель ошибается не потому, что "не умеет думать", а потому, что ей дали слишком шумный или эмоционально окрашенный ввод.

Что делает техника

У модели есть уязвимость: она может слишком сильно реагировать на framing input-а. Например:

пользовательский тон слишком эмоциональный;
жалоба смешивает факт и интерпретацию;
вопрос задаётся с уже встроенным bias;
в длинном тексте много нерелевантных деталей.

S2A вставляет промежуточную фазу:

выделить релевантный factual core;
только потом строить answer.

То есть техника защищает reasoning не напрямую, а через более чистый вход.

Плюсы

Снижает влияние нерелевантных cues
Полезен для noisy tickets, long emails и эмоциональных inputs
Хорошо сочетается с summarization и routing
Может улучшать judge и analysis tasks

Минусы

Добавляет дополнительный шаг
Можно случайно потерять важную деталь
Не нужен для коротких чистых запросов
Требует eval на loss of information

Где техника особенно уместна

Лучшие сценарии:

customer support;
incident reports;
legal or compliance intake;
research notes;
product feedback analysis;
noisy internal communication;
tasks, где пользователь сам задаёт biasing interpretation.

Почему S2A полезен именно как preprocessing layer

Эта техника сильнее всего не как "ещё один reasoning trick", а как фильтр перед основным route. Она особенно полезна, когда downstream модель в целом компетентна, но входные данные мешают ей проявить это:

эмоциональный шум давит на тон ответа;
нерелевантные детали забивают рабочую память;
user framing подталкивает к поспешному выводу;
factual core размазан по жалобе или длинному треду.

В таких случаях S2A улучшает не reasoning-механику модели, а качество входа, на котором эта механика будет работать.

Менее полезна техника:

на уже clean structured inputs;
в JSON-only automation;
там, где upstream already does strong extraction;
на коротких ясных вопросах.

То есть S2A особенно полезен на human-written noisy input и заметно менее полезен на machine-prepared structured state.

В чём сила и риск S2A

Сила техники:

модель не так легко уходит в эмоциональную окраску;
facts отделяются от interpretation;
ответ становится более operational.

Главный риск:

preprocessing может случайно вырезать именно ту деталь, которая была критична.

Поэтому S2A нельзя внедрять без проверки на information loss.

Если используете S2A, полезно просить модель возвращать не только cleaned input, но и список отброшенных элементов. Так легче понять, не потеряли ли вы что-то важное.

Хороший prompt pattern

Практически устойчивый вариант выглядит так:

Выдели факты, числа, ограничения, наблюдения.
Отдели эмоции, интерпретации, blame language и speculation.
Ответь только по factual layer.

Так техника работает лучше, чем расплывчатое "очисти вход от шума".

Что именно нельзя терять при очистке

Даже при aggressive cleanup важно сохранять:

числа;
таймлайны;
указания на severity;
подтверждённые факты vs предположения;
ограничения и requested action.

Если эти вещи теряются, cleaned input становится чище, но хуже с точки зрения реальной задачи.

Сравнение с соседними техниками

System 2 Attention

Переписывает noisy input в более чистую форму

Re-Reading

Повторно читает исходный input без явной фильтрации

System 2 Attention

Чистит noisy input

Context-Faithful Prompting

Усиливает опору на given context против parametric memory

System 2 Attention

Помогает выделить signal из noisy text

Instruction Hierarchy

Определяет, каким инструкциям доверять больше

Частые ошибки

Плохой вариант S2A — считать, что любое эмоциональное или длинное описание надо aggressively чистить. Иногда эмоция сама по себе является полезным сигналом, например для severity или user urgency.

Ещё типичные ошибки:

стирать все contextual hints;
смешивать factual rewrite и final answer в один абзац;
не логировать cleaned version;
не измерять, сколько важной информации теряется.

Когда лучше взять соседнюю технику

Если проблема в том, что модель:

не опирается на данный документ -> Context-Faithful Prompting;
неправильно определяет приоритет инструкций -> Instruction Hierarchy;
плохо понимает сам вопрос -> Rephrase and Respond.

S2A особенно хорош именно тогда, когда input noisy, а не тогда, когда trust model или grounding уже сломаны на другом уровне.

Проверьте себя

1. Что делает S2A в первую очередь?

Очищает вход от шума перед ответом Добавляет больше эмоций в prompt Заменяет retrieval

2. Когда S2A особенно полезен?

Когда вход noisy, biased или эмоционально перегружен Когда нужно просто короткое приветствие Только при image generation

3. Главный риск S2A?

Случайно выкинуть важную деталь Слишком красивый ответ Недостаток XML

Structured Reflection

System Prompts

System 2 Attention (S2A)

Суть в двух словах

Что делает техника

Плюсы

Минусы

Где техника особенно уместна

Почему S2A полезен именно как preprocessing layer

В чём сила и риск S2A

Хороший prompt pattern

Что именно нельзя терять при очистке

Сравнение с соседними техниками

Частые ошибки

Когда лучше взять соседнюю технику

Practical use

Полезный production-паттерн

Что стоит мерить

Practical telemetry

Проверьте себя