Chain of Draft (CoD)

[object Object]

Chain of Draft, или CoD, — это способ просить модель мыслить короткими черновыми шагами вместо длинных развёрнутых рассуждений. Практический смысл техники в 2026 простой: если reasoning trace нужен, но полный Chain-of-Thought слишком дорог по токенам, CoD может дать часть той же пользы при меньшей цене и latency.

Представьте черновик на полях: не длинное объяснение, а короткие пометки вроде «сравнить A/B», «3 риска», «итог -> B». CoD просит модель делать именно такие шаги.

Суть в двух словах

CoD = reasoning trace, но в сильно сжатом виде.

Подходит, когда:

  • нужен промежуточный reasoning;
  • важна экономия токенов;
  • задача допускает краткие рассуждения без длинных пояснений.
ПромптGPT-5 mini
Реши задачу. Сначала сделай very short draft steps: максимум 5 слов на шаг. Потом дай итоговый ответ.

В компании 120 клиентов, churn 5% в месяц. Сколько клиентов останется примерно через 3 месяца, если не будет новых?
Ответ модели

Draft:

  1. 120 * 0.95
  2. результат * 0.95
  3. ещё раз * 0.95
  4. округлить

Ответ: примерно 103 клиента.

Зачем нужен CoD, если уже есть CoT

Обычный Chain-of-Thought полезен, но дорог:

  • длиннее по токенам;
  • медленнее;
  • иногда переобъясняет очевидное;
  • не всегда нужен downstream.

CoD предлагает компромисс:

  • оставить краткий reasoning trace;
  • но сделать его телеграфным и функциональным.

То есть это budget reasoning mode, а не новая универсальная замена CoT.

Плюсы

  • Снижает token cost по сравнению с развёрнутым CoT
  • Часто сохраняет качество на structured reasoning tasks
  • Подходит для plan-first prompts и outline-like thinking
  • Полезен в latency-sensitive workflows

Минусы

  • Может потерять полезные детали на сложных задачах
  • Не лучший формат для обучения пользователя
  • Может ухудшать ответы, если сделать trace слишком телеграфным
  • На скрыто-reasoning моделях внешний draft может быть лишним

Когда техника особенно полезна

Хорошие кейсы:

  • internal reasoning helpers;
  • classification with short rationale;
  • concise planning;
  • cost-sensitive support copilots;
  • light analytical prompts;
  • workflows, где reasoning trace нужен машине, а не человеку.

Почему CoD особенно полезен как cost/latency compromise

На практике часто есть неудобный выбор:

  • либо direct answer слишком хрупок;
  • либо полный CoT слишком дорог и многословен.

Chain of Draft закрывает именно этот промежуток. Он полезен как компромиссный режим, когда reasoning trace ещё нужен, но уже не хочется платить за длинное объяснение каждого шага.

Менее полезен CoD:

  • для educational explanations;
  • для аудита reasoning человеком;
  • для high-stakes legal/medical explanation;
  • когда hidden reasoning provider-side already good enough.

Если downstream-пользователю нужно не просто решение, а понятная аргументация, draft-mode почти всегда слишком сжат. Это хороший internal trace, но плохой explanatory artifact.

Практическое правило 2026

Сегодня CoD стоит воспринимать не как замену всем reasoning-техникам, а как budget mode:

  • full explanation, если её будет читать человек;
  • short draft, если важны скорость и стоимость;
  • hidden reasoning, если модель уже умеет думать без внешнего trace.
Лучший CoD — это не "самый короткий возможный текст", а "минимально достаточный черновик". Если после сокращения trace уже невозможно восстановить ход решения, вы переусердствовали.

Хороший prompt pattern

Полезно ограничивать:

  • максимум слов на шаг;
  • максимум шагов;
  • обязательный отдельный final answer.

Без этих ограничений draft быстро превращается обратно в длинный CoT и теряет смысл.

Что делает draft рабочим

Полезный draft:

  • достаточно короткий;
  • сохраняет порядок reasoning;
  • помогает понять, откуда взялся final answer;
  • не пытается быть мини-эссе.

Плохой draft:

  • уже не читается как reasoning path;
  • дублирует final answer;
  • слишком обрывочен, чтобы быть полезным;
  • или наоборот снова становится обычным CoT.

Сравнение с соседними техниками

Chain of Draft
Короткий, budget-friendly reasoning trace
Chain of Thought
Более подробное и human-readable reasoning
Chain of Draft
Черновые reasoning steps
Skeleton-of-Thought
Outline структуры финального ответа
Chain of Draft
Внешний краткий trace доступен пользователю или приложению
Hidden reasoning
Reasoning остаётся внутри provider/runtime

Частые ошибки

Главная ошибка — сделать draft настолько коротким, что он уже не помогает reasoning, а лишь имитирует его. Тогда вы теряете и прозрачность, и качество.

Ещё типичные проблемы:

  • draft смешивается с final answer;
  • число шагов не ограничено;
  • техника используется там, где нужен полноценный explanation;
  • никто не меряет, даёт ли CoD выигрыш относительно normal CoT.

Когда лучше выбрать другую технику

Если проблема не в длине CoT, а в его надёжности, лучше идти не в CoD, а в:

  • Self-Consistency;
  • Plan-and-Solve;
  • tool use;
  • verification.

CoD оптимизирует budget, но не решает системно проблему плохого reasoning quality.

Техническая реализация

prompt = """
Реши задачу.
Сначала выведи черновик рассуждения:
- не более 5 слов на шаг
- не более 6 шагов
Потом выведи финальный answer отдельно.
"""

Practical guardrails

  • ограничивайте длину draft;
  • отделяйте draft от final answer;
  • не просите CoD там, где downstream ждёт строгий JSON без лишнего текста;
  • проверяйте, улучшает ли draft accuracy при acceptable token budget.

Что стоит измерять

  • token savings vs CoT;
  • latency delta;
  • answer quality delta;
  • user comprehension, если draft виден наружу.

Так вы поймёте, где CoD действительно полезен, а где он просто модная, но бесполезная микрооптимизация.

Production use

В production CoD особенно уместен как:

  • optional low-cost route;
  • internal rationale layer;
  • concise plan format before execution;
  • fallback между direct answer и full CoT.

Проверьте себя

Проверьте себя

1. В чём практический смысл Chain of Draft?

2. Когда CoD особенно уместен?

3. Что часто является ошибкой?