Chain of Draft (CoD)

[object Object]

Chain of Draft, или CoD, — это способ просить модель мыслить короткими черновыми шагами вместо длинных развёрнутых рассуждений. Практический смысл техники в 2026 простой: если reasoning trace нужен, но полный Chain-of-Thought слишком дорог по токенам, CoD может дать часть той же пользы при меньшей цене и latency.

Представьте черновик на полях: не длинное объяснение, а короткие пометки вроде «сравнить A/B», «3 риска», «итог -> B». CoD просит модель делать именно такие шаги.

Зачем нужен CoD, если уже есть CoT

Обычный Chain-of-Thought полезен, но дорог:

длиннее по токенам;
медленнее;
иногда переобъясняет очевидное;
не всегда нужен downstream.

CoD предлагает компромисс:

оставить краткий reasoning trace;
но сделать его телеграфным и функциональным.

То есть это budget reasoning mode, а не новая универсальная замена CoT.

Плюсы

Снижает token cost по сравнению с развёрнутым CoT
Часто сохраняет качество на structured reasoning tasks
Подходит для plan-first prompts и outline-like thinking
Полезен в latency-sensitive workflows

Минусы

Может потерять полезные детали на сложных задачах
Не лучший формат для обучения пользователя
Может ухудшать ответы, если сделать trace слишком телеграфным
На скрыто-reasoning моделях внешний draft может быть лишним

Когда техника особенно полезна

Хорошие кейсы:

internal reasoning helpers;
classification with short rationale;
concise planning;
cost-sensitive support copilots;
light analytical prompts;
workflows, где reasoning trace нужен машине, а не человеку.

Почему CoD особенно полезен как cost/latency compromise

На практике часто есть неудобный выбор:

либо direct answer слишком хрупок;
либо полный CoT слишком дорог и многословен.

Chain of Draft закрывает именно этот промежуток. Он полезен как компромиссный режим, когда reasoning trace ещё нужен, но уже не хочется платить за длинное объяснение каждого шага.

Менее полезен CoD:

для educational explanations;
для аудита reasoning человеком;
для high-stakes legal/medical explanation;
когда hidden reasoning provider-side already good enough.

Если downstream-пользователю нужно не просто решение, а понятная аргументация, draft-mode почти всегда слишком сжат. Это хороший internal trace, но плохой explanatory artifact.

Практическое правило 2026

Сегодня CoD стоит воспринимать не как замену всем reasoning-техникам, а как budget mode:

full explanation, если её будет читать человек;
short draft, если важны скорость и стоимость;
hidden reasoning, если модель уже умеет думать без внешнего trace.

Лучший CoD — это не "самый короткий возможный текст", а "минимально достаточный черновик". Если после сокращения trace уже невозможно восстановить ход решения, вы переусердствовали.

Хороший prompt pattern

Полезно ограничивать:

максимум слов на шаг;
максимум шагов;
обязательный отдельный final answer.

Без этих ограничений draft быстро превращается обратно в длинный CoT и теряет смысл.

Что делает draft рабочим

Полезный draft:

достаточно короткий;
сохраняет порядок reasoning;
помогает понять, откуда взялся final answer;
не пытается быть мини-эссе.

Плохой draft:

уже не читается как reasoning path;
дублирует final answer;
слишком обрывочен, чтобы быть полезным;
или наоборот снова становится обычным CoT.

Сравнение с соседними техниками

Chain of Draft

Короткий, budget-friendly reasoning trace

Chain of Thought

Более подробное и human-readable reasoning

Chain of Draft

Черновые reasoning steps

Skeleton-of-Thought

Outline структуры финального ответа

Chain of Draft

Внешний краткий trace доступен пользователю или приложению

Hidden reasoning

Reasoning остаётся внутри provider/runtime

Частые ошибки

Главная ошибка — сделать draft настолько коротким, что он уже не помогает reasoning, а лишь имитирует его. Тогда вы теряете и прозрачность, и качество.

Ещё типичные проблемы:

draft смешивается с final answer;
число шагов не ограничено;
техника используется там, где нужен полноценный explanation;
никто не меряет, даёт ли CoD выигрыш относительно normal CoT.

Когда лучше выбрать другую технику

Если проблема не в длине CoT, а в его надёжности, лучше идти не в CoD, а в:

Self-Consistency;
Plan-and-Solve;
tool use;
verification.

CoD оптимизирует budget, но не решает системно проблему плохого reasoning quality.

Проверьте себя

1. В чём практический смысл Chain of Draft?

Сделать reasoning trace короче и дешевле Полностью заменить structured outputs Убрать необходимость в eval

2. Когда CoD особенно уместен?

Когда важны latency и cost Когда нужен юридически значимый аудит Когда нельзя показывать промежуточные шаги вообще

3. Что часто является ошибкой?

Сделать draft слишком телеграфным или снова слишком длинным Отделять final answer от draft Ограничивать число шагов

Chain of Density (CoD)

Chain of Thought (CoT)

Chain of Draft (CoD)

Суть в двух словах

Зачем нужен CoD, если уже есть CoT

Плюсы

Минусы

Когда техника особенно полезна

Почему CoD особенно полезен как cost/latency compromise

Практическое правило 2026

Хороший prompt pattern

Что делает draft рабочим

Сравнение с соседними техниками

Частые ошибки

Когда лучше выбрать другую технику

Техническая реализация

Practical guardrails

Что стоит измерять

Production use

Проверьте себя