Auto-CoT — это техника, в которой few-shot reasoning examples не пишутся вручную, а генерируются автоматически. В 2026 её правильнее понимать не как prompt trick для обычного чата, а как offline prompt-construction pipeline: она особенно полезна там, где вы строите reusable demonstrations для целого класса задач.
Если few-shot CoT хорош, но собирать хорошие примеры руками долго и дорого, Auto-CoT пытается сделать это автоматически.
Ниже автоматически подобранные reasoning-примеры для задач этого класса. Используй их как ориентир решения.
[Demo 1]
...
[Demo 2]
...
[Demo 3]
...
Теперь реши новую задачу.
Ответ модели
Модель получает не случайные ручные примеры, а заранее сгенерированный и отфильтрованный набор demonstrations, близкий к типу текущей задачи.
Сила техники проявляется там, где вопросы отличаются по словам, но повторяют один и тот же pattern решения. Например:
финансовые word problems;
support triage кейсы;
однотипные аналитические разборы;
учебные задачи внутри одного формата.
В таких сценариях не нужен один идеальный demonstration. Нужен небольшой набор representative examples, который покрывает семейство задач. Auto-CoT как раз помогает собрать такой набор без полностью ручной работы.
Плюсы
Снижает ручной труд по созданию few-shot demonstrations
Масштабируется на целые task families
Помогает строить reusable prompt templates
Полезен для systematic prompt iteration
Минусы
Сложнее простого CoT и zero-shot CoT
Плохие auto-generated demos могут закрепить ошибки
Требует offline pipeline и filtering
Часто избыточен для современных managed reasoning tiers
Автоматически сгенерированный reasoning нельзя blindly trust. Обычно нужны:
quality filter;
rubric-based scoring;
deduplication;
anti-noise cleanup;
проверка на hallucinated steps.
Хороший filter обычно проверяет не только correctness финального ответа, но и:
нет ли лишних шагов;
не слишком ли длинный reasoning;
соответствует ли explanation вашему стилю;
не закрепляет ли demo вредные shortcuts или leakage.
Самая опасная версия Auto-CoT — без фильтрации. Тогда вы получаете автоматически произведённые, но плохо контролируемые demos, которые потом масштабируют ошибку на все новые запросы.
Как только demonstrations становятся reusable asset, у них появляется обычная продуктовая жизнь:
их нужно версионировать;
переоценивать после смены модели;
выбрасывать устаревшие примеры;
следить, не переобучают ли они prompt на narrow pattern.
Именно поэтому Auto-CoT особенно хорошо сочетается с prompt registry. Без версий и истории изменений demos быстро превращаются в legacy-блок текста, который все боятся редактировать.
Не превращайте Auto-CoT в бесконечный генератор всё новых demos. Если pipeline не умеет выбрасывать слабые и устаревшие demonstrations, prompt только растёт и шумит.