o3 и o4-mini были важной точкой в эволюции reasoning-моделей OpenAI: именно через них reasoning перестал быть редким экспериментом и стал обычным API-выбором с управляемой глубиной мышления, tool use и image reasoning. Но на 20 марта 2026 про них уже нельзя писать как про “текущий основной reasoning-слой OpenAI”. В official model docs o3 помечена как succeeded by GPT-5, а o4-mini — как succeeded by GPT-5 mini.
Это не делает их неактуальными. Скорее меняется их роль: в 2026 они важны как reference reasoning-модели, migration checkpoints и legacy routing options внутри OpenAI-стека. Если вы уже строили пайплайны вокруг o3 или o4-mini, статья всё ещё нужна. Если вы стартуете с нуля, смотреть на них надо уже рядом с GPT-5 и GPT-5 mini, а не вместо них.
GPT-5-линию. Поэтому o3 и o4-mini лучше понимать как важные reasoning-reference модели и legacy options, а не как автоматический default для новых проектов.o3 и o4-mini важны не только как отдельные модели, а как переходный слой OpenAI к productized reasoning.
По official materials OpenAI:
o3 была high-end reasoning-моделью для сложных coding, math и multimodal задач;o4-mini проектировалась как более дешёвая и быстрая reasoning-модель с сильным quality-per-dollar;reasoning.effort.Именно поэтому они до сих пор полезны как practical reference: через них проще понять, как OpenAI вообще оформляет reasoning API.
Главная проблема старых обзоров в том, что они всё ещё описывают o3 и o4-mini как текущий центр OpenAI reasoning stack. Это уже неточно.
На 20 марта 2026 official model pages говорят:
o3 — succeeded by GPT-5;o4-mini — succeeded by GPT-5 mini.Практический вывод:
GPT-5-линией на реальных evals, а не выбирать “по инерции”.По current official docs и pricing:
| Модель | Context window | Max output | Input | Cached input | Output |
|---|---|---|---|---|---|
o3 | 200,000 | 100,000 | $2.00 / 1M | $0.50 / 1M | $8.00 / 1M |
o4-mini | 200,000 | 100,000 | $1.10 / 1M | $0.275 / 1M | $4.40 / 1M |
Это уже важнее старых benchmark-таблиц, потому что именно такие цифры влияют на production-routing.
Практически:
o4-mini заметно рациональнее для budget-sensitive reasoning;o3 всё ещё может быть оправдана там, где цена ошибки выше цены токенов.o3 не стоит описывать просто как “старую дорогую reasoning-модель”. На official launch page OpenAI подчёркивает:
Практически o3 до сих пор логична для:
o3 может оставаться разумным выбором даже после появления GPT-5. Здесь важнее стоимость неправильного вывода, чем сам факт, что модель уже не current default.o4-mini была ценна не как “урезанная o3”, а как fast cost-efficient reasoning lane OpenAI.
OpenAI отдельно подчёркивала:
Для 2026 это значит:
o4-mini удобно держать как legacy reasoning default;o3 уже слишком дорога;GPT-5 mini.reasoning.effort: главная инженерная фичаСтарые статьи часто подают reasoning как “магическое скрытое мышление”. Для практики важнее другое: o3 и o4-mini дали разработчику управляемую ручку глубины анализа.
| Уровень | Что происходит | Когда использовать |
|---|---|---|
low | Минимальный внутренний анализ | Простые reasoning-задачи, cost-sensitive traffic |
medium | Баланс качества, стоимости и latency | Дефолт для большинства инженерных задач |
high | Максимально глубокий анализ | Сложный код, математика, дорогие по ошибке кейсы |
Важно:
reasoning.summary;Ещё одно место, где старый обзор устарел: он строился вокруг Chat Completions как главного интерфейса. В current OpenAI docs reasoning guide уже ведёт разработчика через Responses API.
По official guide:
responses.create;reasoning={"effort": ...};summary, чтобы получить краткую reasoning summary.Это меняет и developer ergonomics, и то, как надо писать обучающую статью в 2026.
Это главный сдвиг. Новая OpenAI framing уже идёт через GPT-5 и GPT-5 mini.
Если задача не требует deep reasoning, вы платите за неиспользованную глубину.
200K всё ещё много, но это больше не уникальный headline advantage на рынке 2026.