GigaChat (Сбер)

Актуальный обзор GigaChat на 18 марта 2026: GigaChat 2 Lite / Pro / Max, 128K контекст, API-тарифы, OpenAI-совместимость, файлы, функции и практическая роль в российском AI-стеке.

Старый обзор GigaChat уже конфликтует с текущим состоянием платформы. На 18 марта 2026 у Сбера в центре не GigaChat / Plus / Pro с 32K, а линейка GigaChat 2 Lite / Pro / Max с 128K контекстом, функциями, файлами, OpenAI-совместимым API и отдельными тарифными моделями для физлиц и бизнеса.

Именно так GigaChat и стоит оценивать сейчас:

  • как российский vendor stack с сильным русскоязычным профилем;
  • как API-платформу, а не только consumer-чат;
  • как practical choice для задач с локальным правовым и языковым контекстом;
  • как модельный стек с разными cost/quality tiers, а не с расплывчатыми Plus и Pro.
GigaChat — это семейство моделей и API от Сбера. Если говорить совсем просто: GigaChat 2 Lite нужен для дешёвых и быстрых задач, GigaChat 2 Pro — для более серьёзных прикладных сценариев, GigaChat 2 Max — для наиболее сложных запросов и richer multimodal work.
Главная правка к старой статье такая: модели первого поколения уже недоступны как основная линия. В официальной документации Сбер прямо пишет, что запросы к GigaChat, GigaChat-Pro и GigaChat-Max автоматически перенаправляются на GigaChat-2, GigaChat-2-Pro и GigaChat-2-Max.

Коротко

Что важноАктуальный ответ
Базовая модель по умолчаниюGigaChat 2 Lite
Основной middle tierGigaChat 2 Pro
Самая сильная модель линейкиGigaChat 2 Max
Контекст128K у всех трёх
Главный practical плюссильный русский контекст + локальная интеграция в РФ

Практические роли GigaChat 2:

МодельРольКогда брать
GigaChat 2 Litefast/cheap defaultрутинные запросы, массовый inference, FAQ, внутренние ассистенты
GigaChat 2 Probalanced production tierсуммаризация, рерайтинг, юридические и экономические сценарии
GigaChat 2 Maxstrongest quality tierсложные инструкции, richer multimodal input, high-quality русскоязычные задачи

Что у GigaChat сейчас действительно важно:

  • 128K контекст вместо старых 8K/32K;
  • функции у всей линейки;
  • OpenAI-совместимый API;
  • работа с файлами и документами;
  • freemium-режим для физлиц;
  • pay-as-you-go и пакетные тарифы для бизнеса;
  • сильный practical fit для российского рынка и русского языка.

1. Как сейчас устроен GigaChat

Старый обзор слишком упрощал продукт до “русская модель от Сбера”. В 2026 GigaChat стоит понимать как platform layer с:

  • несколькими generation-моделями;
  • embeddings-линией;
  • OpenAI-compatible и native SDK интеграциями;
  • file handling;
  • function calling;
  • preview-моделями;
  • отдельной тарифной логикой для физлиц и юрлиц.

2. GigaChat 2 Lite / Pro / Max: старая схема Plus / Pro больше не помогает

Официальный guide по выбору модели перечисляет только три актуальные generation-модели:

  • GigaChat-2;
  • GigaChat-2-Pro;
  • GigaChat-2-Max.

По docs:

  • по умолчанию API и SDK используют GigaChat 2 Lite;
  • Pro предназначена для более комплексных задач;
  • Max — продвинутый tier для наиболее сложной работы.

Это уже нормальная production-лестница, а не consumer-подписка с неясными уровнями.

3. Контекст и мультимодальность: статья больше не должна говорить про 32K

Все три актуальные модели имеют 128 000 токенов контекста. Это ключевая правка.

При этом мультимодальность распределена неравномерно:

  • GigaChat 2 Lite принимает только текст;
  • GigaChat 2 Pro и GigaChat 2 Max принимают текст, изображения и аудио;
  • все модели могут выдавать текст, а через встроенные функции также работать с изображениями и 3D.
Если вам нужен именно multimodal input, начинать надо не с Lite, а с Pro или Max. Lite — это дешёвый текстовый baseline, а не универсальная мультимодальная модель.
GigaChat: practical profile
Russian-language fit94%
Local market relevance95%
OpenAI compatibility79%
Global ecosystem breadth54%
Self-hosting flexibility12%

4. Цены и что они значат на практике

По model pages и тарифам Сбера, базовая стоимость generation сегодня такая:

  • GigaChat 2 Lite65 ₽ за 1M токенов;
  • GigaChat 2 Pro500 ₽ за 1M;
  • GigaChat 2 Max650 ₽ за 1M.

Для физлиц есть freemium:

  • 900 000 бесплатных токенов Lite;
  • 50 000 бесплатных токенов Pro;
  • 50 000 бесплатных токенов Max;
  • лимит обновляется раз в 12 месяцев.

Для бизнеса есть:

  • пакетные покупки токенов;
  • pay-as-you-go;
  • синхронный и асинхронный режимы;
  • у async-режима цена ниже примерно вдвое.

Это делает GigaChat полезным не только как “доступную российскую модель”, но и как реальный costed API-service для production.

Плюсы

  • Сильный practical fit для русского языка и российского контекста
  • Есть дешёвый Lite-tier и более сильные Pro/Max tiers
  • OpenAI-compatible API снижает миграционные издержки
  • Поддерживаются функции, файлы, embeddings и multimodal input
  • Есть freemium и локальные рублёвые тарифы без зарубежной биллинговой инфраструктуры

Минусы

  • Для физлиц по умолчанию доступен только один поток API
  • Экосистема и tooling layer заметно уже, чем у OpenAI/Anthropic/Google
  • Есть тематические safety-ограничения, включая политику
  • Это не open-weight стек и не локально запускаемая модель

5. OpenAI compatibility и SDK: сильная сторона, но не идеальная замена

Официальная документация прямо описывает совместимость GigaChat API с OpenAI SDK.

Это значит, что можно:

  • использовать base_url="https://gigachat.devices.sberbank.ru/api/v1";
  • делать chat.completions;
  • вызывать models;
  • создавать embeddings;
  • работать с functions.

Сбер отдельно предупреждает, что совместимость частичная, и для полного доступа к возможностям лучше использовать собственные библиотеки:

  • gigachat для Python;
  • gigachat-js для JS/TS;
  • langchain-gigachat.

То есть GigaChat хорошо подходит для адаптации существующего OpenAI-кода, но всё ещё не является drop-in replacement без оговорок.

6. Файлы, функции и workflow-возможности

Старый текст почти не отражал, что GigaChat уже умеет не только “чатиться”.

Официальные SDK-guides описывают:

  • загрузку файлов через POST /files;
  • просмотр и удаление файлов;
  • скачивание сгенерированных изображений;
  • функцию обработки документов;
  • function calling;
  • batch processing.

Это ставит GigaChat ближе к современным API-платформам, где модель работает не изолированно, а как часть application workflow.

7. Ограничения, о которых нужно говорить честно

У GigaChat есть важные operational ограничения:

  • физлицам доступен 1 поток API;
  • юрлицам и ИП по умолчанию доступно 10 потоков;
  • тематические ограничения включают политику и ряд чувствительных категорий;
  • для работы SDK часто нужно установить сертификаты НУЦ Минцифры;
  • токен доступа действует 30 минут.

Это не делает сервис слабым, но объясняет, почему GigaChat лучше оценивать как российский production option с собственной операционной спецификой, а не как универсальный глобальный default.

ПромптGigaChat 2 Pro
Подготовь короткое объяснение для российского малого бизнеса: чем отличается УСН «доходы» от УСН «доходы минус расходы», когда какой режим обычно выгоднее и какие есть типовые ошибки.
Ответ модели

Именно в таких русскоязычных прикладных сценариях GigaChat 2 Pro выглядит особенно уместно: модель хорошо работает с российским контекстом, а сама платформа Сбера удобна для команд, которым важны рублёвые тарифы и локальная инфраструктурная рамка.

8. Когда выбирать GigaChat, а когда нет

Выбирайте GigaChat, если вам нужно

  • сильное понимание русского языка и российских реалий;
  • локальный API-вендор с рублёвой оплатой;
  • migration path через OpenAI-compatible API;
  • прикладные сценарии в экономике, праве, поддержке, документообороте;
  • массовый дешёвый inference на Lite.

Смотрите альтернативы, если вам нужно

  • максимально широкий международный ecosystem/tooling moat;
  • сильнейший coding tier без поправки на локальный рынок;
  • more permissive global integrations;
  • open-weight или on-prem self-hosting без привязки к vendor API.

Для разработчика

Practical decision framework

СценарийСтартовая точка
Fast cheap Russian baselineGigaChat 2 Lite
Strong text quality для прикладных задачGigaChat 2 Pro
Strongest GigaChat-tierGigaChat 2 Max
Быстрая миграция с OpenAI SDKOpenAI-compatible mode
Тест ранних обновлений-preview модели

Проверьте себя

Проверьте себя

1. Какая линейка GigaChat актуальна на 18 марта 2026?

2. Какая модель GigaChat используется по умолчанию в API и SDK?

3. Что из этого лучше всего описывает сильную сторону GigaChat в 2026?