Компоненты контекста

Компоненты Context Engineering в 2026: instructions, retrieval, conversation state, durable memory, tool results и output constraints.

В 2026 полезно мыслить контекст не как один большой prompt, а как набор шести рабочих слоёв: instructions, retrieval, conversation state, durable memory, tool results и output constraints. Именно из этих блоков обычно собирается input для LLM-приложения.

Важно: эти компоненты не равны по ценности. Одни задают рамку поведения, другие приносят факты, третьи держат continuity, четвёртые обеспечивают machine-readable output. Хороший Context Engineering начинается не с вопроса “что ещё добавить в prompt”, а с вопроса какой слой реально нужен для этой задачи.

Представьте, что вы собираете briefing для специалиста. В нём есть правила работы, нужные документы, текущее состояние кейса, известные факты о клиенте, ответы внешних систем и требуемый формат результата. У LLM всё устроено примерно так же.

Короткая версия

Шесть основных компонентов контекста:

Компонент	Что делает	Пример
Instructions	задаёт роль, policy и правила	“Ты — support assistant, не выдумывай статусы заказов”
Retrieval	даёт внешние факты и документы	статья help center или chunk из базы знаний
Conversation state	держит текущий ход диалога	последние сообщения, открытые вопросы, текущая цель
Durable memory	хранит долгоживущие факты	язык пользователя, тариф, предпочтения
Tool results	приносит свежие данные из систем	статус заказа, баланс, SQL result
Output constraints	задаёт формат результата	JSON schema, strict tool args, UI contract

ПромптContext layers

Запрос: «Почему заказ задерживается?»

Контекст:
- instructions: support policy
- retrieval: краткая статья о сроках доставки
- state: последние 2 сообщения
- memory: язык и тип аккаунта
- tool result: order_status=pending_carrier
- output constraint: JSON для support UI

Ответ модели

Ответ строится не на догадках, а на policy + live data + нужном формате. Это и есть работа компонентов контекста как системы.

Что чаще всего путают

retrieval и tool results не одно и то же;
conversation state и memory не одно и то же;
output constraints тоже часть контекста, а не отдельная тема “после prompt engineering”;
runtime metadata полезны, но это скорее вложенный вспомогательный слой, а не самостоятельная большая категория наравне с retrieval или tools.

1. Instructions

Instructions — это system prompt, policy blocks, guardrails и output-level указания. Они отвечают за то, как модель должна себя вести.

Сюда обычно входят:

роль модели;
стиль и тон;
правила uncertainty и refusal;
запреты и policy boundaries;
format hints и safety contract.

Этот слой чаще всего:

наиболее стабилен между запросами;
должен быть коротким и непротиворечивым;
хорошо подходит для prompt caching.

Не складывайте сюда всё подряд. Instructions не должны заменять retrieval, memory и tool results. Если system prompt раздувается до огромного “супер-досье”, вы обычно лечите не ту проблему.

2. Retrieval

Retrieval нужен тогда, когда модель должна опираться на ваши внешние знания, а не только на pretraining.

Типичные источники:

help center;
policy docs;
product catalog;
codebase fragments;
tickets, contracts, SOPs.

Практически retrieval отвечает за два вопроса:

Какие именно документы нужно подмешать в текущий вызов?
Сколько retrieved context реально стоит включать?

Ключевая мысль: retrieval полезен не количеством найденных chunks, а их relevance contribution.

Без техники

{ "title": "Плохо", "content": "Отправляем 12 chunks из базы знаний, потому что модель «держит большое окно»." }

С техникой

{ "title": "Лучше", "content": "Отправляем 2-4 самых полезных chunks, которые реально нужны для ответа или цитирования." }

3. Conversation State

Conversation state — это рабочее состояние текущего диалога. Не “вся история навсегда”, а то, что нужно модели прямо сейчас для continuity.

Обычно сюда входят:

последние сообщения;
активная задача;
открытые вопросы;
текущая стадия workflow;
последний важный tool result.

Если история длинная, healthy pattern почти всегда такой:

свежие turns передаются как есть;
старые turns compact-ятся в summary/state object;
мусорные или завершённые ветки выкидываются.

4. Durable Memory

Durable memory хранит факты, которые живут дольше одной сессии.

Примеры:

предпочтительный язык;
имя или роль пользователя;
account tier;
постоянные предпочтения по output;
важные long-term facts.

Memory отличается от conversation state так:

Слой	Что хранит
Conversation state	что происходит в этой сессии прямо сейчас
Durable memory	что стоит помнить между сессиями

Если смешать их в один слой, вы быстро получите либо перегруженный context, либо потерю continuity.

5. Tool Results

Tool results — это live data, полученные от систем во время выполнения: API, database, search, calculators, workflow tools.

Они отличаются от retrieval тем, что:

retrieval обычно подмешивается до ответа;
tool results возникают в ходе выполнения или после tool call;
tool results чаще всего более “grounded”, потому что это свежий structured output системы.

Типовые примеры:

статус заказа;
баланс и billing events;
SQL aggregation;
web search results;
результат browser/computer action.

Если нужен точный текущий статус объекта, почти всегда сначала нужен tool result, а не retrieval-документ о правилах системы.

6. Output Constraints

Output constraints — это JSON schema, structured outputs, strict tool arguments, UI contracts и другие формальные ограничения на то, в каком виде модель должна вернуть результат.

Этот слой часто недооценивают, хотя он критичен для:

automation;
agent loops;
frontend rendering;
data extraction;
machine-readable responses.

Без него модель может “понять задачу правильно”, но вернуть ответ в форме, которую приложение не сможет использовать.

7. Куда деть дату, язык, timezone и прочие метаданные

Runtime metadata никуда не исчезли. Просто в зрелой taxonomy их полезнее считать не отдельным огромным компонентом, а вспомогательным атрибутом внутри других слоёв:

дата и timezone часто живут рядом с instructions;
язык пользователя может приходить из durable memory;
session flags могут быть частью conversation state;
locale и UI-mode могут входить в output contract.

Это делает контекст чище и помогает не создавать искусственный “седьмой слой”, который на деле редко является главным носителем смысла.

8. Как эти компоненты работают вместе

Обычно здоровая последовательность такая:

Instructions задают рамку.
Retrieval даёт внешние знания.
Conversation state держит текущую continuity.
Durable memory добавляет долгоживущие user facts.
Tool results приносят свежие данные.
Output constraints фиксируют форму результата.

Типовой порядок слоёв

Instructions20%

Retrieval25%

Conversation state20%

Durable memory10%

Tool results15%

Output constraints10%

Это не универсальные проценты, а mental model: разные слои выполняют разные функции, и у каждого должен быть собственный budget и priority.

Плюсы

Помогает проектировать контекст как систему, а не как один prompt
Даёт ясное разделение между knowledge, state, memory и live data
Упрощает budget discipline и observability
Делает агентные и production-сценарии предсказуемее

Минусы

Добавляет архитектурную сложность: слои нужно хранить и собирать отдельно
Требует discipline, иначе слои быстро смешиваются
Без метрик трудно понять, какой компонент реально улучшает качество
Лишние или дублирующие блоки быстро раздувают context

Простой layered assembler

from dataclasses import dataclass, field


@dataclass
class ContextLayers:
    instructions: str
    retrieval: list[str] = field(default_factory=list)
    recent_messages: list[dict] = field(default_factory=list)
    memory_facts: list[str] = field(default_factory=list)
    tool_results: list[dict] = field(default_factory=list)
    output_contract: str | None = None


def build_messages(layers: ContextLayers) -> list[dict]:
    system_parts = [layers.instructions]

    if layers.memory_facts:
        system_parts.append(
            "Known facts:\n- " + "\n- ".join(layers.memory_facts)
        )

    if layers.output_contract:
        system_parts.append(
            f"Output contract:\n{layers.output_contract}"
        )

    messages = [
        {"role": "system", "content": "\n\n".join(system_parts)}
    ]

    if layers.retrieval:
        messages.append(
            {
                "role": "system",
                "content": "Retrieved context:\n\n"
                + "\n\n---\n\n".join(layers.retrieval[:4]),
            }
        )

    messages.extend(layers.recent_messages[-4:])

    for result in layers.tool_results[-2:]:
        messages.append(
            {"role": "tool", "content": str(result)}
        )

    return messages

Смысл этого кода не в синтаксисе, а в разделении слоёв:

retrieval не прячется внутри instructions;
memory не смешивается с transcript-history;
tool results ограничиваются по объёму;
output contract живёт отдельно от business facts.

Проверьте себя

1. Чем conversation state отличается от durable memory?

{ "text": "Ничем, это одно и то же", "correct": false, "explanation": "Нет. Conversation state — это текущий ход диалога, а durable memory — факты, которые переживают одну сессию." } { "text": "Conversation state хранит текущую сессию, durable memory — долгоживущие факты", "correct": true, "explanation": "Верно. Это одно из ключевых различий в зрелом Context Engineering." } { "text": "Durable memory нужна только агентам", "correct": false, "explanation": "Нет. Она полезна и support-, и copilot-, и personalization-сценариям." }

2. Чем tool results отличаются от retrieval?

{ "text": "Tool results — это live data из систем, retrieval — внешние документы и знания", "correct": true, "explanation": "Да. Retrieval приносит reference knowledge, а tool results — свежие structured данные во время выполнения." } { "text": "Retrieval всегда точнее, чем tool results", "correct": false, "explanation": "Не всегда. Если нужен текущий статус объекта, tool result обычно надёжнее." } { "text": "Разницы нет, это два названия одного слоя", "correct": false, "explanation": "Это разные контекстные компоненты с разной ролью." }

3. Почему output constraints считаются частью контекста?

{ "text": "Потому что они задают форму результата, который должен вернуть модель", "correct": true, "explanation": "Верно. JSON schema, strict tool args и UI contracts напрямую влияют на пригодность ответа." } { "text": "Потому что они заменяют retrieval", "correct": false, "explanation": "Нет. Они не приносят знания, а ограничивают формат результата." } { "text": "Только потому, что это удобно в документации", "correct": false, "explanation": "Нет. В production это реальный operational layer." }

Источники

Multi-turn Context Strategies

Паттерны Context Engineering