Cost Attribution for AI в 2026: кто именно потратил токены, tool calls и inference budget
Cost attribution for AI в 2026: project, tenant, route, tool и feature-level разрезы расходов, чтобы cost optimization перестал быть гаданием.
Cost attribution for AI в 2026 нужна потому, что общий monthly spend почти ничего не объясняет. Для production-команды важнее другой вопрос: какой tenant, feature, route, tool или workflow реально съедает бюджет и даёт ли это соответствующий quality gain. Без этого cost optimization превращается в хаотичное ужимание токенов и слепой downgrade.
Cost attribution похож на разбор расходов бизнеса по подразделениям. Общая сумма за месяц полезна для CFO, но бесполезна для инженера, который должен понять, почему внезапно подорожал support copilot или какой agent workflow стал слишком дорогим.
Самый вредный anti-pattern - считать только стоимость по модели или провайдеру. Для AI-систем этого мало: дорожают не только модели, но и tool loops, retrieval depth, retries, approvals, fallback paths и long-running sessions.
Если cost нельзя привязать к route и trace, команда почти неизбежно начнёт экономить на неправильном слое: например, на модели вместо retries, retrieval depth или tool loop discipline.
1. Link provider spend to traces
2. Add route and tenant tags
3. Track tool-step contributions
4. Compare cost with quality and outcome
5. Review anomalies after routing or policy changes
Практический совет: если после релиза вырос счёт, первый вопрос должен быть не "какая модель подорожала", а "какой route, step или tenant изменил экономику системы". Это почти всегда даёт более точный и менее разрушительный путь оптимизации.