HyDE, или Hypothetical Document Embeddings, решает частую проблему retrieval: короткий пользовательский запрос слишком беден, чтобы хорошо лечь в embedding space. Вместо прямого поиска по голому вопросу модель сначала генерирует гипотетический документ, как будто уже знает, каким должен быть хороший ответ, а затем retrieval ищет реальные тексты, похожие именно на этот документ.

В 2026 эта техника особенно полезна в zero-shot и weak-query сценариях. Она не делает ответ "магическим", но заметно улучшает качество первого retrieval шага, когда у пользователя запрос короткий, разговорный или неполный.

HyDE генерирует не финальный ответ для пользователя, а промежуточный текстовый proxy, который помогает retriever понять, что именно искать.

Коротко

HyDE полезен, когда:

  • запрос слишком короткий;
  • query написан разговорно;
  • обычный dense retrieval не находит нужный контекст;
  • нет размеченных relevance labels.
ПромптGPT-5
Сначала сгенерируй гипотетический документ, который мог бы содержать ответ. Затем используй его как поисковый proxy.

Запрос: как уменьшить latency у агентной системы с несколькими API-вызовами?
Ответ модели

Модель сначала описала документ про orchestration, parallel tool calls и dependency graph, после чего retrieval вернул более релевантные материалы про workflow planning, чем при поиске по исходному короткому запросу.

HyDE нужен не для галлюцинации, а для лучшего поиска реальных документов.

Почему HyDE работает

У простого retrieval есть известная слабость: пользовательский запрос часто слишком короткий и не содержит терминов, которые реально встречаются в релевантных документах. HyDE добавляет промежуточный слой:

  1. модель пишет hypothetical document;
  2. этот документ кодируется в embedding;
  3. retrieval ищет реальные близкие тексты.

Так модель расширяет query семантически, но искать всё равно продолжает по реальному корпусу.

Прямой retrieval
Система ищет документы по короткому или неудачно сформулированному запросу пользователя и часто промахивается по vocabulary и semantic framing.
HyDE
Система сначала генерирует более насыщенный гипотетический документ и уже по нему ищет реальные релевантные тексты.

Когда техника особенно полезна

HyDE хорошо показывает себя в:

  • корпоративном поиске;
  • FAQ и knowledge base, где пользователи формулируют запросы неязыком документации;
  • multilingual retrieval;
  • zero-shot dense retrieval;
  • случаях, где query expansion важнее, чем сложная reranking-логика.

Техника особенно полезна, если вы видите, что релевантный документ в базе есть, но retriever его стабильно не находит.

Ограничения

Главный риск HyDE в том, что плохой hypothetical document может увести поиск в неправильную тему. Если модель слишком рано "догадалась" не туда, retriever только усилит этот bias.

Поэтому HyDE лучше использовать:

  • с короткими контролируемыми prompts;
  • с ограничением на стиль hypothetical document;
  • вместе с reranking и постпроверкой retrieved evidence.

Почему техника актуальна в 2026

По мере роста enterprise RAG становится очевидно, что проблема часто не в генерации, а в слабом первом retrieval hit. HyDE полезен как дешёвый слой semantic expansion без обязательного fine-tuning retriever.

Это делает технику практичной для команд, которым нужен прирост recall без большого ML-проекта.

Техническая реализация

const hypotheticalDoc = await model(generateHypotheticalDocPrompt(query))
const queryEmbedding = await embed(hypotheticalDoc)
const docs = await vectorSearch(queryEmbedding)

Практический совет: храните рядом исходный query и hypothetical document. Это помогает быстро увидеть, где HyDE реально расширяет смысл, а где просто шумит.

Проверьте себя

1. Что HyDE добавляет к обычному retrieval?

2. Когда HyDE особенно полезен?

3. Главный риск HyDE?