Customer-Facing AI SLAs в 2026: что именно обещать клиенту, когда AI деградирует не как обычный API
Customer-facing AI SLAs в 2026: как формулировать обещания по latency, queueing, citations, review и degraded modes, чтобы SLA отражал реальное поведение AI-сервиса, а не только uptime.
Customer-facing AI SLAs в 2026 нужны потому, что AI-продукт редко можно честно описать только через uptime и HTTP errors. Пользователю важны другие вопросы: сколько ждать human review, доступны ли citations, какие actions временно выключены, когда ответ может прийти в draft-only режиме и как меняется поведение сервиса в degraded state. Если SLA этого не отражает, контракт обещает одно, а реальный продукт ведёт себя иначе.
AI SLA — это обещание не только о доступности, но и о режиме работы capability: latency, quality floor, очередь, ручной режим, внешние действия, freshness и статус evidence. Пользователь должен понимать, что именно продукт гарантирует в норме и в деградации.
Самый вредный anti-pattern - копировать generic SaaS SLA и просто подставлять слово AI. Тогда contract говорит только про uptime, но ничего не объясняет про delayed review, partial disablement, degraded citations и fallback routes.
SLA должен быть capability-oriented, а не только infra-oriented;
review queues и manual mode часто требуют отдельных обещаний;
citations, evidence и external actions нельзя смешивать с обычным response uptime;
пользователю нужно явно видеть границу между available, degraded и temporarily restricted.
Без техники
Контракт обещает 99.9% availability, но не говорит ничего о том, что risky actions могут уходить в 12-часовой review queue.
С техникой
SLA отдельно описывает response latency, review turnaround, citation-backed mode, manual-mode behavior и customer updates during degradation.
ПромптSLA intuition
Почему uptime не покрывает реальный AI user experience?
Ответ модели
Потому что AI может быть формально доступен, но уже работать медленнее, без citations, только в draft mode или с очередью на approvals. Для клиента это разные operational states.
Если эти состояния допустимы по контракту, это нужно сформулировать прямо. Если недопустимы, тем более.
Если capability может перейти в manual mode без полного outage, SLA должен говорить не только "доступно ли", но и "в каком operational режиме это считается нормой или деградацией".
1. Что считается доступностью для каждой capability?
2. Какие degraded modes допустимы и как они сообщаются?
3. Есть ли отдельный SLA для review and approval queues?
4. Что продукт сознательно не гарантирует?
5. Когда клиент получает следующий incident update?
Практический совет: хороший AI SLA не обещает магию. Он обещает понятное поведение системы в норме, в очереди, в деградации и в ограниченном режиме.
Проверьте себя
1. Почему uptime сам по себе плохо описывает AI SLA?
2. Что особенно важно включить в customer-facing AI SLA?