Tool Use и Function Calling

Tool Use в 2026: как модели вызывают custom tools, built-in tools и MCP-инструменты в OpenAI, Anthropic и Google API.

Tool use в 2026 уже нельзя описывать просто как "модель вернула JSON с именем функции". Это всё ещё базовый primitive, но поверх него выросли три разных слоя:

custom tools, которые вы исполняете в своём коде;
built-in tools, которые исполняет сам провайдер;
MCP tools, которые приходят из внешнего tool ecosystem.

Именно поэтому current статья про tool use должна объяснять не только function calling, но и разницу между tool selection, tool execution и tool governance.

Модель сама не "нажимает кнопку" и не "ходит в интернет" магическим образом. Она выбирает действие и формирует структурированный запрос. Дальше либо ваш код исполняет этот запрос, либо это делает provider-side built-in tool, либо действие уходит в MCP-сервер.

Не смешивайте tool use и structured output. JSON-ответ модели и вызов инструмента выглядят похоже, но это разные вещи. В одном случае вы хотите получить финальные данные в схеме. В другом случае вы хотите, чтобы модель инициировала действие или достала внешнюю информацию.

1. Что такое tool use на практике

Tool use полезнее всего понимать как мост между языком и действиями.

У модели есть цель:

получить внешние данные;
сделать вычисление;
вызвать внутренний сервис;
запустить bounded action;
передать работу во внешний tool environment.

Тогда она не должна галлюцинировать ответ "из головы", а должна попросить нужный инструмент.

Это и есть основной engineering value:

меньше hallucinations на актуальных данных;
больше deterministic behavior;
возможность строить agent loops, а не только chat interfaces.

2. Три класса инструментов

Custom tools

Это классический function calling:

вы описываете имя;
даёте schema;
пишете executor;
валидируете аргументы;
возвращаете результат модели.

Сценарии:

CRM lookup;
internal API;
SQL or search endpoint;
billing/status checks;
bounded write actions.

Built-in tools

Это tools, которые поставляет сам провайдер:

web search;
code execution;
computer use;
file search;
provider-side connector tools.

Здесь ownership другой:

tool contract задаёт провайдер;
execution идёт не у вас;
billing и safety model могут отличаться от custom tool path.

MCP tools

MCP добавляет ещё один слой: tool registry и execution surface из внешнего стандартизированного протокола.

Практический эффект:

модель получает доступ не к hardcoded set ваших функций;
а к расширяемой внешней tool ecosystem;
где transport, discovery и capability negotiation уже стандартизированы.

3. Как выглядит текущая provider landscape

OpenAI

Current OpenAI framing уже строится вокруг Responses API и tools, а не вокруг старого launch-era chat.completions as default.

Практически важно следующее:

есть function calling для custom tools;
есть built-in tools;
есть strict schema path;
есть agent/runtime integrations, где tools живут внутри larger loop;
есть MCP path в OpenAI Agents SDK.

То есть current OpenAI tool use уже не сводится к "добавьте functions в запрос".

Anthropic

Anthropic historically использует термин tool use, и current Claude stack сильнее завязан на:

agent loops;
coding and computer-use scenarios;
reasoning + tools;
MCP-centric workflows.

Важно, что в Anthropic ecosystem tools и agent runtime часто живут ближе друг к другу, чем в старых function-calling tutorials.

Google

Gemini current docs подчёркивают:

function calling как bridge to real-world actions;
unique id для function calls;
SDK automation, где часть wiring берёт на себя client library;
сочетание built-in tools и function calling, особенно в Gemini 3 stack.

Это делает Google path ближе к mixed-tool environment, а не к чисто ручному JSON loop.

4. Где чаще всего ломается tool use

Самые частые failure modes почти никогда не сводятся к "модель не знает, что такое функция".

Обычно ломается одно из пяти мест:

модель выбрала не тот tool;
модель выбрала верный tool, но плохие аргументы;
executor вернул слишком шумный или нестабильный output;
loop не понял, что делать после tool result;
safety/policy layer не отделён от tool layer.

Поэтому хороший tool use в 2026 строится не вокруг magic prompting, а вокруг:

ясных schema;
bounded toolsets;
валидаторов;
retries и failure states;
tracing.

5. Когда tool use лучше workflow, а когда хуже

Tool use полезен, если:

путь выполнения частично неизвестен заранее;
нужен выбор между несколькими actions;
модель должна решать, когда данных недостаточно;
нужен adaptive loop.

Tool use избыточен, если:

шаги полностью deterministic;
одно API нужно вызвать всегда;
модель не должна выбирать способ действия;
важнее predictability, чем autonomy.

В таком случае лучше обычный workflow:

код выбирает шаг;
модель только формирует текст или structured result;
tool selection не делегируется LLM.

Если система уже знает, что надо вызвать get_order_status(order_id), не заставляйте модель "догадываться" об этом через tool choice. Tool use нужен там, где выбор действительно полезно отдать модели.

6. Tool contract важнее prompt magic

Хороший tool contract обычно включает:

точное имя;
ясное описание use case;
строгую schema;
понятные ограничения;
предсказуемый output format;
explicit failure semantics.

Плохой contract выглядит так:

инструмент называется слишком общо;
description не говорит, когда его применять;
schema допускает мусор;
executor возвращает giant blob без структуры.

Плохой contract

name: search description: поиск params: query

Нормальный contract

name: search_incidents description: Search incident records by service name, incident id, or keyword. Use when the user asks about outages, postmortems, or ongoing incidents. params: query: string limit: integer only_open: boolean

7. Safety и approvals

В 2026 опасно обсуждать tool use без governance.

Даже если tool schema идеальна, остаются риски:

destructive actions;
data exfiltration;
over-broad file or DB access;
prompt injection через tool outputs;
repeated retries и loops.

Поэтому рядом с tool use обычно должны жить:

allowlists;
permission modes;
tool-level guardrails;
approval steps;
trace logs.

8. Tool use и MCP

MCP не заменяет tool use. Он расширяет среду, из которой tools приходят.

То есть:

function calling отвечает на вопрос "как модель инициирует вызов";
MCP отвечает на вопрос "как tools и context стандартизированно предоставляются приложению и модели".

Это важное различие:

можно иметь tool use без MCP;
можно использовать MCP как источник tools для agent runtime;
можно строить гибридную систему с custom tools, built-in tools и MCP tools одновременно.

Плюсы

Даёт доступ к актуальным данным и реальным действиям
Уменьшает hallucinations там, где нужен внешний source of truth
Позволяет строить adaptive agent loops
Нормально сочетается с built-in tools и MCP
Хорошо масштабируется от simple workflows до coding/research agents

Минусы

Требует контрактов, validation и governance, а не только prompt
Не каждый workflow стоит превращать в tool selection problem
Ошибки в descriptions и schema быстро приводят к bad calls
Built-in и custom tools имеют разную safety/economics model
Без tracing и stop conditions debugging становится болезненным

OpenAI-style custom tool

from openai import OpenAI

client = OpenAI()

tools = [
    {
        "type": "function",
        "function": {
            "name": "get_order_status",
            "description": "Return current order status by order id.",
            "parameters": {
                "type": "object",
                "properties": {
                    "order_id": {"type": "string"},
                },
                "required": ["order_id"],
                "additionalProperties": False,
            },
        },
    }
]

response = client.responses.create(
    model="gpt-5.2",
    input="Check order A-44319",
    tools=tools,
)

Current practical point здесь не в синтаксисе, а в том, что tool use в OpenAI лучше мыслить через current Responses API, а не через старый tutorial-only chat.completions baseline.

Gemini-style function calling

from google import genai

client = genai.Client()

get_weather = {
    "name": "get_weather",
    "description": "Return weather for a city",
    "parameters": {
        "type": "object",
        "properties": {
            "city": {"type": "string"},
        },
        "required": ["city"],
    },
}

response = client.models.generate_content(
    model="gemini-3-flash",
    contents="What's the weather in Almaty?",
    config={"tools": [get_weather]},
)

У Gemini current docs отдельно подчёркивают function-call id и SDK automation, поэтому ручной loop там уже не единственная mental model.

Что обычно надо проверять в ревью

Tool descriptions различимы между собой.
Schema реально ограничивает аргументы.
Executor возвращает короткий, предсказуемый результат.
Destructive tools защищены approvals или permissions.
Loop знает, когда остановиться и когда эскалировать failure.

ПромптTooling review

У нас 30 внутренних API. Что сломается первым?

Ответ модели

Обычно не сама модель, а tool surface: overlapping descriptions, слишком широкий доступ, слабые schema и noisy outputs. Сначала сужают набор tools и делают contracts различимыми.

MCP (Model Context Protocol) — как tools попадают в стандартизированную внешнюю среду
OpenAI Agents SDK — tool use внутри runtime с handoffs, sessions и tracing
Claude Agent SDK — Claude-first agent runtime, permissions, Skills и MCP workflows
Отладка агентов — как ловить bad tool selection, loops и state bugs

Проверьте себя

1. Что лучше всего отличает built-in tool от custom tool?

{ "text": "Built-in tool обычно исполняется на стороне провайдера, а custom tool исполняете вы", "correct": true, "explanation": "Верно. Для модели они оба выглядят как инструменты, но ownership и execution path разные." } { "text": "Built-in tool никогда не использует schema", "correct": false, "explanation": "Это не так. Важна не отсутствие schema, а другой execution ownership." } { "text": "Custom tool всегда хуже по качеству", "correct": false, "explanation": "Нет. Часто custom tool как раз лучше для точного внутреннего use case." }

2. Почему нельзя смешивать structured output и tool use?

{ "text": "Потому что tool use вообще не использует JSON", "correct": false, "explanation": "Tool use как раз часто использует структурированные аргументы." } { "text": "Потому что одно про финальную схему результата, а другое про инициирование действия или получения внешних данных", "correct": true, "explanation": "Да. В этом и состоит ключевое различие." } { "text": "Потому что они поддерживаются разными моделями", "correct": false, "explanation": "Нет, многие current модели поддерживают оба подхода." }

3. Когда tool selection не стоит отдавать модели?

{ "text": "Когда нужный action заранее полностью известен и deterministic", "correct": true, "explanation": "Верно. В этом случае обычный workflow надёжнее и дешевле." } { "text": "Когда tools меньше трёх", "correct": false, "explanation": "Количество инструментов само по себе не является критерием." } { "text": "Когда модель умеет reasoning", "correct": false, "explanation": "Reasoning не делает tool selection автоматически полезным." }

Источники

Tool Trust Tiers в 2026: почему не все инструменты и их результаты должны считаться одинаково надёжными

Как писать MCP-серверы