o3 и o4-mini — reasoning-модели OpenAI, которые сделали линейку o практической для реальных продуктов: не просто «умные модели», а API с управляемой глубиной рассуждений, tool use и image reasoning. Но на 16 марта 2026 про них важно говорить честно: это уже не единственная и не главная точка входа в OpenAI-экосистему. В developer docs OpenAI прямо помечает o3 как succeeded by GPT-5, а o4-mini — как succeeded by GPT-5 mini.
Это не делает их бесполезными. Наоборот: они остаются хорошей reference-точкой, чтобы понять, что именно OpenAI называет reasoning-моделью, как работает reasoning_effort, и почему в некоторых сценариях старая o-линейка всё ещё интересна для сравнения и миграций.
GPT-5 / GPT-5 mini. Это инженерный вывод из официальных страниц моделей, где o3 и o4-mini обозначены как succeeded.o3 и o4-mini были важны по двум причинам:
reasoning_effort, который отделил «быстрый ответ» от «глубокого анализа».По официальным материалам OpenAI:
o3 позиционировалась как флагман reasoning-линейки;o4-mini — как более дешёвая reasoning-модель с очень сильным результатом за свои деньги;На практике это означало: OpenAI перестала продавать reasoning как редкий эксперимент и превратила его в обычный продуктовый выбор внутри API.
| Модель | Context window | Max output | Цена вход / выход за 1M | Cached input |
|---|---|---|---|---|
o3 | 200,000 | 100,000 | $2.00 / $8.00 | $0.50 |
o4-mini | 200,000 | 100,000 | $1.10 / $4.40 | $0.275 |
Это заметно отличается от старых таблиц и ранних обзоров, где можно встретить другие цены. Если вам нужен актуальный production-расчёт, ориентироваться стоит только на текущие official docs и pricing.
Практический вывод простой:
o4-mini — заметно рациональнее, если у вас чувствительный бюджет;o3 имеет смысл там, где цена ошибки выше цены токенов.o3 важна не просто как «дорогая модель OpenAI», а как reasoning-слой с высоким ceiling. На официальной странице OpenAI подчёркивает:
Это делает o3 хорошей моделью для:
o3 по-прежнему может быть оправдана даже после появления GPT-5. Здесь важно не «новее/старее», а сколько вам стоит неправильный вывод модели.o4-mini была ценна тем, что делала reasoning намного доступнее по цене. OpenAI отдельно выделяла её за сочетание:
o3;В официальных материалах OpenAI для o4-mini есть особенно показательная цифра: 99.5% pass@1 на AIME 2025 при использовании Python. Это хороший пример того, что модель задумывалась не как «обрезанный o3», а как очень серьёзный STEM-инструмент.
Практически o4-mini была и остаётся полезной, если вам нужно:
o3;GPT-5 mini.reasoning_effort: почему это ключевая фичаreasoning_effort — главная причина, по которой o3 и o4-mini до сих пор удобны как reference-модели.
| Уровень | Что происходит | Когда использовать |
|---|---|---|
low | Минимум внутреннего анализа | Простые reasoning-задачи, cost-sensitive traffic |
medium | Баланс качества и цены | Дефолт для большинства инженерных задач |
high | Максимально глубокий анализ | High-stakes reasoning, сложный код, математика |
Здесь важно понимать: reasoning-токены не бесплатны. Они входят в completion usage и делают итоговую стоимость существенно выше, если вы бездумно ставите high везде.
Честный обзор должен включать и ограничения.
Это главный сдвиг. В 2026 году нельзя писать про o3 и o4-mini так, будто это единственный путь в OpenAI reasoning. Документация OpenAI уже сдвинула основной акцент на GPT-5 и GPT-5 mini.
200K — это много, но уже не выглядит рекордом на фоне более новых моделей и конкурентов с 1M.
Если задача не требует глубокого reasoning, вы просто платите за неиспользованную глубину.
| Сценарий | Что делать |
|---|---|
У вас уже есть production-routing на o3 / o4-mini | Не мигрируйте вслепую. Сначала сравните на своих evals с GPT-5 / GPT-5 mini. |
| Вы строите новый продукт на OpenAI | Начните сравнение с новой GPT-5-линейки, а o3/o4-mini оставьте как benchmark-кандидатов. |
| Вам нужен дорогой по ошибке reasoning | Тестируйте o3 против GPT-5 на вашем датасете. |
| Вам нужен дешёвый reasoning внутри OpenAI | Сравните o4-mini с GPT-5 mini по качеству, latency и цене. |