Skeleton-of-Thought (SoT)

[object Object]

Skeleton-of-Thought, или SoT, — это техника, где модель сначала строит краткий каркас ответа, а уже потом разворачивает детали по разделам. В 2026 её удобно воспринимать как outline-first generation: она полезна не только для writing, но и для planning, analysis и section-by-section workflows, где структура ответа важнее мгновенной генерации текста.

Вместо того чтобы сразу писать длинный ответ целиком, модель сначала набрасывает структуру. Это как сначала составить содержание доклада, а потом заполнять разделы.

Зачем вообще нужен skeleton

Монолитная генерация длинного ответа часто ломается так:

важный раздел забывается;
середина ответа уезжает в сторону;
концовка оказывается слабее начала;
структура выходит неровной;
разные части дублируют друг друга.

Skeleton-of-Thought помогает, потому что сначала фиксирует shape of answer, а уже потом позволяет модели наращивать содержание.

Плюсы

Даёт управляемую структуру
Снижает риск пропустить важный раздел
Удобен для human review до полной генерации
Хорошо сочетается с section-by-section editing

Минусы

Добавляет ещё один шаг
Не нужен для коротких ответов
Плохой skeleton почти гарантирует плохой финальный текст
Для strict schema outputs есть более прямые техники

Где техника особенно сильна

Лучшие кейсы:

статьи и лонгриды;
internal docs;
executive memo;
due diligence summaries;
launch plans;
educational explanations;
architecture overviews.

Менее полезна техника:

в коротких factual answers;
в JSON/schema outputs;
в small talk;
там, где already constrained form и так задаёт структуру.

Почему SoT полезен не только для writing

Технику легко принять за "приём для текстов", но её реальная ценность шире. Skeleton полезен везде, где сначала нужно зафиксировать shape of output:

аналитическая записка;
набор рекомендаций;
архитектурный разбор;
учебное объяснение;
sectioned report.

То есть SoT хорошо работает не только как writing trick, а как способ стабилизировать multi-section generation.

Как выглядит хороший skeleton

Хороший skeleton:

короткий;
иерархически понятный;
покрывает всю задачу;
не пытается сразу написать ответ целиком;
допускает section-by-section expansion.

Плохой skeleton:

слишком общий;
содержит готовые выводы вместо разделов;
дублирует пункты;
включает слишком много мелких подпунктов.

Что делает skeleton рабочим

Хороший outline:

покрывает все обязательные разделы;
удерживает правильный порядок;
не спорит сам с собой;
задаёт expansion scope для каждого блока.

Это особенно важно в длинных материалах: плохой skeleton потом масштабирует ошибку на весь документ.

Для рабочих задач лучше просить skeleton из 4-7 пунктов. Если пунктов больше, модель часто начинает путаться ещё до expansion phase.

Практический workflow

Самый useful production pattern обычно такой:

Сгенерировать skeleton.
Проверить его человеком или judge.
При необходимости поправить outline.
Раскрывать разделы по одному.

Это даёт два сильных плюса:

плохой план можно остановить раньше;
разделы легче редактировать, проверять и повторно генерировать.

Третий плюс часто недооценивают: такой pipeline проще кэшировать. Если outline уже утверждён, можно регенерировать только один проблемный раздел, а не весь документ целиком.

Как ревьюить skeleton до expansion

Перед разворачиванием полезно проверить outline по четырём вопросам:

покрывает ли он все обязательные аспекты задачи;
нет ли логических дыр между разделами;
не съезжает ли порядок в удобный для модели, но не для читателя;
понятен ли scope каждого пункта.

Это и есть основной quality gate техники. Если плохой skeleton пропустить дальше, expansion обычно только масштабирует исходный structural defect.

Когда section-by-section expansion лучше batch expansion

Есть два рабочих режима:

expand all sections in one go
expand each section separately

Первый быстрее и удобен для средних текстов. Второй лучше, когда:

разделы сильно отличаются по тону или типу работы;
нужен отдельный review каждого блока;
есть риск section drift;
часть разделов должна генерироваться с tools или citations.

В production чаще выигрывает гибрид: skeleton целиком, потом expansion по одному блоку или небольшими батчами.

SoT и соседние техники

Skeleton-of-Thought

Оптимизирует структуру финального ответа

Plan-and-Solve

Строит procedural plan решения

Skeleton-of-Thought

Один outline и последующая expansion

DECOMP

Модульная orchestration между разными handlers

Skeleton-of-Thought

Помогает тексту быть логично организованным

Structured Output

Задаёт machine-readable contract

Частые ошибки

Не просите модель сделать skeleton и сразу в том же ответе написать длинные развёрнутые разделы без разделения фаз. Тогда техника теряет своё главное преимущество — управляемость.

Ещё типичные ошибки:

skeleton слишком длинный;
каждый пункт уже превращён в мини-эссе;
expansion не привязана к конкретным пунктам skeleton;
структура не проходит даже минимальный review.

Когда лучше выбрать другую технику

SoT не лучший выбор, если:

нужен procedural solution plan, а не структура ответа;
требуется строгий machine-readable schema;
ответ короткий и не требует sectioning;
проблема не в структуре, а в фактах или reasoning quality.

В этих случаях чаще лучше работают Plan-and-Solve, Structured Output, RAG или verification patterns.

Проверьте себя

1. Что главное в Skeleton-of-Thought?

Сначала outline, потом expansion Сразу финальный длинный ответ Только JSON output

2. Для чего SoT особенно полезен?

Для длинных структурных ответов Только для математических задач Только для image prompts

3. Какой практический плюс даёт SoT?

Позволяет рано проверить и исправить плохую структуру Убирает необходимость в review Заменяет few-shot

SelfCheckGPT

Socratic Models

Skeleton-of-Thought (SoT)

Суть в двух словах

Зачем вообще нужен skeleton

Плюсы

Минусы

Где техника особенно сильна

Почему SoT полезен не только для writing

Как выглядит хороший skeleton

Что делает skeleton рабочим

Практический workflow

Как ревьюить skeleton до expansion

Когда section-by-section expansion лучше batch expansion

SoT и соседние техники

Частые ошибки

Когда лучше выбрать другую технику

Practical pattern

Почему это удобно инженерно

Где стоит логировать отдельно

Полезный quality gate перед expansion

Что измерять

Проверьте себя