Claude (Anthropic)

Актуальный обзор Claude на 17 марта 2026: Opus 4.6, Sonnet 4.6 и Haiku 4.5, цены, context window, thinking, agentic use и выбор модели.

Claude в 2026 году уже не стоит описывать как абстрактное семейство Opus / Sonnet / Haiku без привязки к конкретным версиям. На 17 марта 2026 актуальная линейка Anthropic для большинства сценариев выглядит так: Claude Opus 4.6, Claude Sonnet 4.6 и Claude Haiku 4.5.

Главная практическая рамка простая. Sonnet 4.6 сейчас выглядит как основной everyday-default для большинства команд и одиночных пользователей, Opus 4.6 нужен для самых тяжёлых агентных и coding-задач, а Haiku 4.5 закрывает low-cost и low-latency сценарии. При этом Anthropic добавила важные штуки не только в качество модели, но и в operational layer: extended thinking, adaptive thinking, 1M context beta, prompt caching и batch pricing.

Claude — это семейство AI-моделей Anthropic. Ими можно пользоваться как готовым чатом на claude.ai или вызывать через API из кода. У Anthropic нет одной «универсально лучшей» модели: Sonnet обычно берут как рабочую лошадку, Opus — для самых сложных задач, Haiku — когда важны скорость и низкая стоимость.

Anthropic сдвинула линейку вперёд: в актуальных docs теперь центральны Opus 4.6, Sonnet 4.6 и Haiku 4.5, а старые обзоры про Opus 4 / Sonnet 4 / Haiku 3.5 уже быстро теряют точность. Отдельно важно, что Sonnet 4.6 указан как default model для Free и Pro на claude.ai, а Opus 4.6 и Sonnet 4.6 получили 1M token context window в beta.

Что важно	Актуальный ответ
Лучший everyday-default	`Claude Sonnet 4.6`
Самая сильная модель Anthropic	`Claude Opus 4.6`
Самая дешёвая актуальная модель	`Claude Haiku 4.5`
Контекст	`200K` у всей линейки, до `1M` в beta у `Opus 4.6` и `Sonnet 4.6`
Thinking	`Extended thinking` у всех текущих моделей, `adaptive thinking` у `Opus 4.6` и `Sonnet 4.6`

Модель	Когда брать	Контекст	Макс. выход	Цена (вход / выход за 1M)
`Claude Opus 4.6`	Самые сложные задачи, coding agents, long-horizon work	`200K`, до `1M beta`	`128K`	`$5 / $25`
`Claude Sonnet 4.6`	Основной production default, coding, chat, документы, API	`200K`, до `1M beta`	`64K`	`$3 / $15`
`Claude Haiku 4.5`	Скорость, cost-sensitive extraction, routing, классификация	`200K`	`64K`	`$1 / $5`

1. Как сейчас устроена линейка Claude

Anthropic в текущих docs разводит модели по очень понятным ролям:

Claude Opus 4.6 — strongest model для most complex tasks;
Claude Sonnet 4.6 — balance of intelligence, speed and cost;
Claude Haiku 4.5 — fastest and cheapest current option.

Это лучше, чем старый язык про «Opus умный, Sonnet средний, Haiku быстрый», потому что теперь различие не только в качестве ответа, но и в операционной модели использования.

Если вы не уверены, с чего стартовать в API, почти всегда имеет смысл проверить Claude Sonnet 4.6 первым. На Opus 4.6 переходят, когда уже видно, что Sonnet упирается в качество, planning depth или надёжность сложной агентной задачи.

2. Контекст и thinking: главное отличие Claude 2026

Anthropic теперь делает ставку не только на базовую модель, но и на режимы мышления.

Context window

Модель	Базовый контекст	Расширенный контекст
`Opus 4.6`	`200K`	до `1M` в beta
`Sonnet 4.6`	`200K`	до `1M` в beta
`Haiku 4.5`	`200K`	нет заявленного `1M beta`

Для большинства продуктовых систем 200K уже достаточно. Но 1M beta важен для длинных кодовых баз, юридических пакетов, research dumps и больших knowledge-workflows, где разбиение контекста само становится источником ошибок.

Extended vs adaptive thinking

Anthropic docs разводят две вещи:

extended thinking — модель тратит дополнительные токены на размышление перед ответом;
adaptive thinking — модель сама подстраивает глубину размышления под задачу.

По текущей таблице моделей:

extended thinking есть у Opus 4.6, Sonnet 4.6 и Haiku 4.5;
adaptive thinking есть у Opus 4.6 и Sonnet 4.6, но не у Haiku 4.5.

Это важный operational shift. Старые статьи про Claude часто обсуждали только «умнее или быстрее», а в 2026 разница уже в том, насколько модель умеет сама регулировать reasoning budget.

Контекст и reasoning в линейке Claude

Haiku 4.5 — context (K)200%

Sonnet 4.6 — context (K)200%

Opus 4.6 — context (K)200%

Sonnet 4.6 — 1M beta1000%

Opus 4.6 — 1M beta1000%

3. Цены и экономика использования

Базовые цены на 17 марта 2026 такие:

Модель	Input	Output	Prompt cache write	Prompt cache hit
`Claude Opus 4.6`	`$5 / 1M`	`$25 / 1M`	`$6.25 / 1M`	`$0.50 / 1M`
`Claude Sonnet 4.6`	`$3 / 1M`	`$15 / 1M`	`$3.75 / 1M`	`$0.30 / 1M`
`Claude Haiku 4.5`	`$1 / 1M`	`$5 / 1M`	`$1.25 / 1M`	`$0.10 / 1M`

Anthropic также указывает Batch API со скидкой 50% от base rates. Это сразу делает Claude интереснее для offline-задач: ночные суммаризации, enrichment, миграции датасетов, массовое извлечение полей.

Плюсы

Sonnet 4.6 даёт сильный баланс качества и цены для production-default
Haiku 4.5 уже не выглядит просто «урезанным Claude» — это нормальный дешёвый inference layer
Prompt caching сильно помогает на длинных system prompts и RAG-конвейерах
Batch API позволяет резко снизить cost для non-interactive workloads

Минусы

Opus 4.6 в массовом онлайне быстро раздувает cost
Thinking-токены стоят как output, поэтому reasoning надо включать осознанно
1M context без дисциплины часто ведёт к дорогому и шумному inference вместо лучшего качества

4. Когда выбирать Claude, а когда нет

Сценарии, где Claude особенно силён

coding assistants и code review;
long-context document analysis;
AI-agents с tool use и несколькими шагами;
системные промпты, где важно строгое следование инструкциям;
mixed workflows с текстом, PDF, изображениями и structured output.

Когда стоит смотреть альтернативы

если нужен самый дешёвый managed inference, DeepSeek может быть дешевле;
если нужен product-first consumer workflow с search, canvas и широким consumer tool layer, чаще удобнее ChatGPT;
если приоритетом становятся multimodal и extremely cheap high-volume flows, иногда выгоднее Gemini 2.5 Flash.

Это не делает Claude слабее. Просто в 2026 выбор модели уже определяется не «кто умнее вообще», а тем, как конкретный стек ведёт себя по цене, latency, tools и контексту.

ПромптClaude Sonnet 4.6

У меня есть сервис на Python/FastAPI. Посмотри на этот обработчик, найди risk points и предложи production-safe rewrite:

@app.post('/users/search')
def search_users(q: str, limit: int = 1000):
    sql = f"SELECT * FROM users WHERE name LIKE '%{q}%' LIMIT {limit}"
    return db.execute(sql).fetchall()

Ответ модели

Здесь сразу несколько проблем: SQL injection через q, отсутствие валидации limit, SELECT *, отсутствие pagination и неявный формат ответа. Production-safe rewrite должен использовать параметризованный запрос, ограничение limit, явный список колонок и pagination. Для FastAPI также лучше вернуть Pydantic-модель и обработать пустой запрос отдельно.

5. Для разработчика: что реально важно в API

Актуальные model IDs

Модель	Рекомендуемый alias	Контекст	Макс. output
`Claude Opus 4.6`	`claude-opus-4-6`	`200K`, до `1M beta`	`128K`
`Claude Sonnet 4.6`	`claude-sonnet-4-6`	`200K`, до `1M beta`	`64K`
`Claude Haiku 4.5`	`claude-haiku-4-5`	`200K`	`64K`

Базовый запрос

import anthropic

client = anthropic.Anthropic()

response = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": "Сделай code review этой Python-функции и укажи риски."
        }
    ],
)

print(response.content[0].text)

Extended thinking

import anthropic

client = anthropic.Anthropic()

response = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=4000,
    thinking={
        "type": "enabled",
        "budget_tokens": 2000
    },
    messages=[
        {
            "role": "user",
            "content": "Спроектируй migration plan для разделения монолита на 3 сервиса."
        }
    ],
)

for block in response.content:
    if block.type == "thinking":
        print(block.thinking)
    elif block.type == "text":
        print(block.text)

Anthropic помечает manual thinking budget как deprecated для Claude Opus 4.6 и рекомендует там adaptive thinking. Для Sonnet 4.6 и Haiku 4.5 обычный thinking-budget всё ещё понятен и удобен как рабочая модель управления расходом.

В прикладном коде для свежих интеграций обычно удобнее использовать aliases вроде claude-sonnet-4-6. Если вам нужна полная воспроизводимость, берите точный snapshot из актуальной таблицы моделей Anthropic docs.

Что стоит помнить при продакшен-выборе

Начинайте с Sonnet 4.6, а не с Opus 4.6, если не доказана необходимость флагмана.
Включайте thinking только на задачах, где reasoning реально окупает стоимость.
Для длинных knowledge-workflows проверяйте не только качество, но и economics с prompt caching.
Для offline enrichment почти всегда стоит оценить Batch API.

Если вам нужно	Начать с
Общий production assistant	`claude-sonnet-4-6`
Сложный coding agent	`claude-opus-4-6`
Дешёвый массовый inference	`claude-haiku-4-5`
Огромный контекст	`claude-sonnet-4-6` или `claude-opus-4-6` с `1M beta`

Источники

ChatGPT (OpenAI)

Claude 4.5 и Sonnet 4.6: переход к текущей Anthropic-линейке