FiD, или Fusion-in-Decoder, стал одним из базовых паттернов retrieval-augmented generation. Его идея в том, что retrieved passages лучше не склеивать в один длинный кусок до чтения, а обрабатывать как отдельные evidence units, которые потом объединяются уже в decoder. Это позволяет модели лучше использовать несколько источников одновременно.

В 2026 FiD остаётся важным ориентиром для RAG-архитектур. Даже если современные системы строятся поверх других моделей, сама идея evidence fusion across multiple retrieved passages остаётся очень живой.

FiD показывает, что multi-document QA выигрывает, когда passages не теряют свою структуру слишком рано.

Коротко

FiD полезен, когда:

  • ответ требует нескольких источников;
  • retrieved passages не стоит грубо склеивать;
  • нужно better evidence aggregation;
  • RAG упирается в качество multi-passage synthesis.
ПромптGPT-5
Собери ответ по нескольким passage units отдельно, а затем синтезируй их в decoder-like step, не смешивая весь контекст в один ранний ком.
Ответ модели

Система сначала рассмотрела несколько passages как отдельные evidence blocks, а затем аккуратно объединила их в итоговый ответ.

Это техника про structured evidence fusion, а не просто про длинный context window.

Чем FiD отличается от простого concatenation-based RAG

В наивном RAG retrieved docs часто просто конкатенируются. Это быстро, но:

  • passages теряют независимую роль;
  • модель хуже отделяет сильные и слабые evidence blocks;
  • multi-source aggregation становится менее устойчивой.

FiD делает ставку на более явную работу с несколькими passages before final generation.

Просто склеенный контекст
Retrieved passages рано превращаются в один длинный блок, и evidence structure частично теряется.
FiD
Пассажи обрабатываются как отдельные evidence units, а их fusion происходит позже и более осмысленно.

Когда техника особенно полезна

FiD хорошо подходит для:

  • open-domain QA;
  • multi-document summarization;
  • knowledge-intensive RAG;
  • fact aggregation across sources;
  • systems, где one-shot concatenation ухудшает groundedness.

Если вопрос закрывается одним точным документом, выгода техники ниже.

Ограничения

FiD может быть тяжёлым по вычислениям, особенно при большом числе passages. Ещё одна проблема — если retrieval принёс много мусора, fusion сама по себе это не исправит.

То есть качество FiD всё ещё сильно зависит от retrieval layer.

Почему техника актуальна в 2026

С ростом контекстных окон temptation просто "засунуть всё в prompt" стала сильнее, но структурная проблема multi-source evidence никуда не ушла. FiD остаётся полезным напоминанием, что важен не только размер контекста, но и способ его объединения.

Это делает технику актуальной для продвинутых RAG stacks и сегодня.

Техническая реализация

const passages = await retrieve(query)
const encoded = passages.map(encodePassage)
const answer = decodeWithFusion(query, encoded)

Практический совет: измеряйте не только answer accuracy, но и sensitivity to number of passages. Для FiD это одна из ключевых operational характеристик.

Проверьте себя

1. Что является ядром FiD?

2. Когда FiD особенно полезен?

3. Главный компромисс FiD?