Практикум: AI-агент-исследователь в 2026

Практикум 2026: research workflow с web search, file search, traces и human review. Как строить planner -> research -> synthesis -> report без хрупкого autonomous loop.

Старый туториал про research agent как Claude + Tavily + длинный Plan-and-Execute loop уже выглядит устаревшим. В 2026 у вас есть более правильные primitives:

web_search как built-in tool;
file_search для собственной базы документов;
deep research models вроде o4-mini-deep-research, если нужен более мощный managed research mode;
traces и human review как часть baseline, а не постфактум.

Поэтому ниже мы строим не "автономного web-краулера", а управляемый research workflow: planner -> collection -> synthesis -> report.

Исследовательский агент - это не магическая модель, которая "сама всё знает". Это workflow: сначала определить вопросы, потом собрать источники, затем свести заметки, и только после этого написать отчёт. Качество здесь зависит не столько от одной модели, сколько от дисциплины пайплайна.

Не давайте research-агенту бесконечный автономный loop с открытым интернетом и без source policy. Такой агент быстро начинает собирать мусор, дублировать источники и тратить бюджет на лишние поиски.

Что мы строим

Практичный research workflow в 2026 обычно состоит из пяти шагов:

Plan - разбить тему на 4-6 исследовательских блоков.
Collect - собрать данные через web_search и, при необходимости, file_search.
Synthesize - убрать дубли, противоречия и слабые источники.
Write - собрать markdown-отчёт с явной структурой.
Review - прогнать quality gate и отдать итог человеку на быстрый sanity check.

Базовая архитектура:

Тема
  -> Planner
  -> Search / Retrieval
  -> Section Notes
  -> Synthesizer
  -> Report Writer
  -> Human Review

Старый research tutorial

Одна модель сама планирует, сама ищет, сама читает десятки страниц и сама пишет финальный текст в бесконечном loop.

Практичный research workflow 2026

Отдельные фазы для plan, collection, synthesis и report. Плюс source policy, traces, budget limits и reviewer.

ПромптResearch workflow

Подготовь обзор по теме: «Как меняется enterprise search после появления reasoning-моделей». Используй интернет и нашу внутреннюю папку с case studies.

Ответ модели

Система сначала строит план разделов, затем ищет внешние источники через web_search, подмешивает внутренние документы через file_search, собирает section notes и только потом пишет отчёт. Итог получается медленнее, чем обычный prompt, но заметно надёжнее.

Если нужен managed research mode, смотрите на o4-mini-deep-research и o3-deep-research. Если нужен более контролируемый production workflow, чаще удобнее собрать planner + retrieval + writer самостоятельно на Responses API.

1. Архитектура research-агента

Research-агент в 2026 лучше мыслить не как chat-bot, а как workflow с разными типами работы:

planner думает о coverage темы;
collector ходит в web_search и file_search;
synthesizer очищает и сшивает заметки;
writer формирует итоговый документ;
review gate проверяет, не выдумал ли пайплайн выводы.

Это проще тестировать, чем один "умный" autonomous agent.

2. Что использовать для поиска и retrieval

Внешний поиск:

web_search в OpenAI Responses API;
web search tool у Anthropic, если ваш стек вокруг Claude;
доменные allow-list'ы и отключение live internet там, где нужен cache-only режим.

Внутренние документы:

file_search, если у вас уже есть vector store у провайдера;
metadata filters для отделения, региона, продукта, типа документа;
отдельные коллекции для policies, research notes, case studies и analyst memos.

Практическое правило простое: research agent почти всегда должен уметь работать и с интернетом, и с внутренними файлами. Только web search редко даёт достаточную полезность для командовой аналитики.

3. Минимальный пайплайн на Python

Ниже не "полноценный фреймворк", а рабочий skeleton. Он делает три вещи:

строит план;
собирает заметки по каждому разделу;
пишет финальный markdown.

import json
from openai import OpenAI

client = OpenAI()
VECTOR_STORE_ID = "vs_internal_research"


def plan_sections(topic: str) -> list[str]:
    response = client.responses.create(
        model="gpt-5-mini",
        input=(
            "Составь research plan из 4-6 разделов. "
            "Верни JSON вида {\"sections\": [\"...\"]}.\n\n"
            f"Тема: {topic}"
        ),
        text={"format": {"type": "json_object"}},
    )
    return json.loads(response.output_text)["sections"]


def collect_notes(topic: str, section: str) -> str:
    response = client.responses.create(
        model="gpt-5.4",
        reasoning={"effort": "medium"},
        tools=[
            {"type": "web_search"},
            {
                "type": "file_search",
                "vector_store_ids": [VECTOR_STORE_ID],
                "max_num_results": 4,
            },
        ],
        include=[
            "web_search_call.action.sources",
            "file_search_call.results",
        ],
        input=(
            "Собери section notes для будущего отчёта.\n"
            "Требования:\n"
            "1. Используй и внешний web search, и внутренний file search, если они релевантны.\n"
            "2. Укажи только проверяемые выводы.\n"
            "3. Верни markdown с буллетами, конфликтами между источниками и списком what-is-uncertain.\n\n"
            f"Тема: {topic}\n"
            f"Раздел: {section}"
        ),
    )
    return response.output_text


def write_report(topic: str, section_notes: dict[str, str]) -> str:
    joined_notes = "\n\n".join(
        f"## {section}\n{notes}" for section, notes in section_notes.items()
    )
    response = client.responses.create(
        model="gpt-5.4",
        input=(
            "Напиши итоговый markdown-отчёт.\n"
            "Структура: executive summary, основные разделы, risks / open questions, conclusion.\n"
            "Не придумывай факты вне заметок.\n\n"
            f"Тема: {topic}\n\n"
            f"Section notes:\n{joined_notes}"
        ),
    )
    return response.output_text


topic = "Как reasoning-модели меняют enterprise search и knowledge work"
sections = plan_sections(topic)
notes = {section: collect_notes(topic, section) for section in sections}
report = write_report(topic, notes)

print(report)

Такой пайплайн уже полезен, потому что:

planner дешёвый;
search и retrieval явно видны;
writer работает по уже очищенным notes, а не по сырым кускам страниц;
вы можете логировать каждую фазу отдельно.

4. Когда нужен deep research model

Если вам нужен не modular workflow, а более мощный managed research mode, OpenAI уже даёт o4-mini-deep-research и o3-deep-research.

Они полезны, когда:

задача действительно длинная и многоэтапная;
нужны internet search и synthesis в одном run;
вы готовы платить за более дорогой reasoning-heavy режим.

Но есть важное ограничение: deep research модели удобны для сложного исследования, а не для каждого обычного аналитического запроса. Для регулярных отчётов, конкурентных обзоров и policy memo часто выгоднее собственный workflow на gpt-5-mini / gpt-5.4 плюс built-in tools.

Плюсы

Workflow проще тестировать и дешевле держать под контролем
web_search и file_search уже закрывают большую часть research use case
Можно жёстко отделить внешние источники от внутренних документов
Traces и per-step review заметно облегчают отладку

Минусы

Нужно самому продумать source policy и dedupe
Без synthesis step отчёт быстро превращается в свалку заметок
Автономный web loop всё ещё легко уходит в лишние поиски
Исследование без human review плохо подходит для high-stakes тем

5. Source policy и budget policy

Надёжный research agent в production почти всегда имеет четыре ограничения:

Слой	Что ограничивать
Search policy	какие домены разрешены и нужен ли live internet
Retrieval policy	какие внутренние коллекции и metadata filters доступны
Budget policy	сколько section runs, search calls и токенов можно потратить
Review policy	какие выводы требуют человеческой проверки перед публикацией

Это особенно важно для тем вроде финансов, регулирования, медицины и enterprise vendor analysis.

6. Что смотреть в traces

Если вы уже используете Agents SDK или другой runtime с трассировкой, research workflow стоит разбирать минимум по таким сигналам:

сколько search calls сделал агент;
какие разделы получили слабое покрытие;
где notes содержат противоречащие друг другу утверждения;
какие секции постоянно приводят к лишним повторам;
какие источники чаще всего оказываются шумом.

Research agent без traces быстро превращается в "вроде что-то нашёл, но непонятно почему так решил".

Туториал: от простого агента до мультиагентной системы - как строить workflow, tool loop и orchestration
Memory в 2026 - как хранить conversation state и durable memory
Eval 2026 - как проверять factuality и coverage research-агентов
Observability в 2026 - traces, spans и route-level debugging

7. Практический вывод

Хороший research agent в 2026 - это не "одна суперумная модель", а аккуратная сборка из planner, search, retrieval, synthesis и report writing.

Если нужен быстрый и управляемый baseline, начинайте с Responses API + web_search + file_search. Если нужен более длинный и тяжёлый managed режим, смотрите на o4-mini-deep-research. Но в обоих случаях главный выигрыш даёт не автономность сама по себе, а качественная source policy и review discipline.

Проверьте себя

1. Почему research agent лучше строить как workflow, а не как бесконечный autonomous loop?

{ "text": "Потому что workflow проще тестировать, ограничивать по бюджету и разбирать по traces", "correct": true, "explanation": "Верно. Разделение на planner, collector, synthesizer и writer делает систему управляемой." } { "text": "Потому что web search вообще не нужен research-агентам", "correct": false, "explanation": "Нет. Web search часто нужен, вопрос в том, как его ограничивать." } { "text": "Потому что autonomous agent не может работать с внутренними файлами", "correct": false, "explanation": "Может, но это не решает проблему контроля и наблюдаемости." }

2. Зачем research agent'у и `web_search`, и `file_search`?

{ "text": "Чтобы совмещать внешние факты и внутренние документы компании", "correct": true, "explanation": "Да. Для командовых исследований одного только интернета обычно мало." } { "text": "Чтобы сделать отчёт длиннее", "correct": false, "explanation": "Длина отчёта не является целью." } { "text": "Потому что `file_search` всегда заменяет planner", "correct": false, "explanation": "Нет. Retrieval не заменяет планирование структуры исследования." }

3. Когда deep research model уместнее обычного planner + tools workflow?

{ "text": "Когда задача действительно длинная, многоэтапная и reasoning-heavy", "correct": true, "explanation": "Верно. Для тяжёлых исследований managed deep research mode может быть удобнее." } { "text": "Для любого короткого вопроса на два абзаца", "correct": false, "explanation": "Это обычно избыточно и дороже." } { "text": "Когда нужно убрать human review", "correct": false, "explanation": "Наоборот, чем сложнее задача, тем важнее review." }

Источники

Практикум: AI-агент для клиентской поддержки в 2026

Практикум: мультиагентный workflow в 2026