Старый обзор YandexGPT уже заметно устарел. На 18 марта 2026 Яндекс стоит описывать не через старую схему YandexGPT Lite / Pro / Pro RC и не только через интеграцию с Алисой, а через Yandex AI Studio как платформу для моделей, агентов и OpenAI-compatible API.
Практически это значит, что в центре сейчас:
YandexGPT Lite 5 как fast/cheap baseline;YandexGPT Pro 5.1 в RC как более сильный production-tier;Alice AI LLM как новый флагман Яндекса для диалогов и AI agents;Responses API, Realtime API, Files API и Vector Store API;Agent Atelier и MCP Hub, а не только “доступ к модели в облаке”.Yandex AI Studio — платформа Яндекса для генеративных моделей и агентов, где YandexGPT и Alice AI LLM выступают как основные native модели.Foundation Models в Yandex AI Studio и добавил агентный слой, OpenAI-compatible Responses/Realtime/Vector Store APIs и новую флагманскую модель Alice AI LLM. Поэтому простой обзор “модель для русского языка + Алиса” уже не описывает реальную платформу.Старый обзор ошибался в том, что описывал YandexGPT как изолированную модель внутри Алисы и Yandex Cloud. В текущей документации Яндекс описывает Yandex AI Studio как платформу для:
AI Playground;Agent Atelier;Realtime API;MCP Hub.YandexGPT Lite 5 / Pro 5.1 / Alice AI LLM: что реально актуальноПо странице доступных моделей в базовом инстансе актуальная native-линейка выглядит так:
Alice AI LLM — gpt://<folder_ID>/aliceai-llm;YandexGPT Pro 5.1 — gpt://<folder_ID>/yandexgpt/rc;YandexGPT Pro 5 — gpt://<folder_ID>/yandexgpt/latest;YandexGPT Lite 5 — gpt://<folder_ID>/yandexgpt-lite.Все эти модели работают с контекстом 32 768 токенов и доступны через:
Это ключевая разница со старой статьёй: сейчас важно не просто “Pro RC”, а ветви latest / rc / deprecated и новая модель Alice AI LLM.
В official overview Яндекс формулирует роли довольно чётко:
YandexGPT Lite — самая маленькая и быстрая модель, полезна для классификации, форматирования и суммаризации;YandexGPT Pro — сильнее для RAG, анализа документов, отчётности и извлечения данных;Alice AI LLM — новый флагман, который сопоставим с YandexGPT Pro в сложных задачах, но заметно лучше в диалоговых сценариях и умеет извлекать информацию из всего полученного контекста.YandexGPT Lite или YandexGPT Pro 5.1. Если вы строите assistant/agent, который должен лучше держать живой диалог, стоит сразу смотреть на Alice AI LLM.0.40 ₽/1KПо актуальной pricing page Yandex AI Studio в рублях:
YandexGPT Lite: 0,2033 ₽ за 1000 входящих и 0,2033 ₽ за 1000 исходящих токенов в синхронном режиме;YandexGPT Pro 5.1: 0,82 ₽ за 1000 входящих и 0,82 ₽ за 1000 исходящих;Alice AI LLM: 0,51 ₽ за 1000 входящих, но 2,03 ₽ за 1000 исходящих.В асинхронном режиме:
YandexGPT Lite: 0,10 ₽ / 1000;YandexGPT Pro 5.1: 0,41 ₽ / 1000;Alice AI LLM: 0,25 ₽ вход и 1,02 ₽ выход.Для OpenAI-compatible APIs pricing page отдельно показывает:
12 марта 2026.Это уже не просто “API от 0.40 ₽/1K”, а более сложный современный pricing layer.
По истории изменений Yandex AI Studio:
25 февраля 2025 вышел YandexGPT Pro 5 в RC с улучшенным function calling, structured output и 32K контекстом;31 марта 2025 появился YandexGPT Lite 5 в RC и поддержка OpenAI tools;28 августа 2025 появился YandexGPT Pro 5.1 в RC, а support for version 4 был прекращён;24 сентября 2025 Foundation Models превратился в Yandex AI Studio, появились Responses API, Realtime API, Vector Store API, Agent Atelier и MCP Hub;25 ноября 2025 Alice AI LLM стала доступна всем пользователям common instance.Это и есть причина, почему статья больше не может быть просто про “семейство моделей и Алису”.
Официальный overview AI Studio перечисляет:
Responses API для текстовых агентов;Realtime API для голосовых агентов;Files API и Vector Store API для файлов и поиска;OpenAI SDK;LangChain и LangGraph.Практически это значит, что Яндекс теперь конкурирует не только как provider text model, а как локальная agent platform.
Особенно важно, что Agent Atelier и MCP Hub выводят AI Studio в сторону enterprise/agent workflows, а не только bare model endpoint.
По странице quotas and limits у Yandex AI Studio сегодня важны такие значения:
10 concurrent generations в synchronous mode;10 async requests per second;5000 async requests per hour;10 concurrent voice sessions;30 MCP servers per cloud;50 tools per server;3 дня.Это уже важно для production-проектов: у Яндекса есть нормальная квотная модель, но это не infinite-scale playground.
Нужен русскоязычный AI-ассистент для банка: он должен поддерживать естественный диалог, искать информацию по базе знаний, отвечать по регламентам и при необходимости вызывать внешние инструменты.
Именно здесь современный стек Яндекса выглядит сильнее всего. Alice AI LLM хорошо подходит как диалоговая модель, а Yandex AI Studio даёт вокруг неё Responses API, Files API, Vector Store API и агентные инструменты, так что вы выбираете не просто модель, а целую платформу.
32K;