Skeleton-of-Thought, или SoT, — это техника, где модель сначала строит краткий каркас ответа, а уже потом разворачивает детали по разделам. В 2026 её удобно воспринимать как outline-first generation: она полезна не только для writing, но и для planning, analysis и section-by-section workflows, где структура ответа важнее мгновенной генерации текста.
Вместо того чтобы сразу писать длинный ответ целиком, модель сначала набрасывает структуру. Это как сначала составить содержание доклада, а потом заполнять разделы.
разделы легче редактировать, проверять и повторно генерировать.
Третий плюс часто недооценивают: такой pipeline проще кэшировать. Если outline уже утверждён, можно регенерировать только один проблемный раздел, а не весь документ целиком.
Не просите модель сделать skeleton и сразу в том же ответе написать длинные развёрнутые разделы без разделения фаз. Тогда техника теряет своё главное преимущество — управляемость.
Ещё типичные ошибки:
skeleton слишком длинный;
каждый пункт уже превращён в мини-эссе;
expansion не привязана к конкретным пунктам skeleton;
def skeleton_is_ready(items: list[str]) -> bool:
if not 4 <= len(items) <= 7:
return False
if any(len(item.split()) > 14 for item in items):
return False
return True
Такой примитивный gate не заменяет review, но хорошо отсеивает две частые поломки: слишком рыхлый outline и outline, который уже превратился в пол-статьи.