DSP, или Demonstrate-Search-Predict, это техника, в которой модель работает в трёх последовательных режимах. Сначала она получает demonstrations того, как выглядит нужная задача, затем получает retrieved evidence, и только после этого делает prediction. То есть few-shot learning и retrieval здесь не конкурируют, а складываются в один pipeline.

В 2026 этот паттерн важен как хороший reminder: для knowledge-heavy задач полезно давать модели не только внешние факты, но и формат поведения. Retrieval отвечает за знание, demonstrations — за способ использования этого знания.

Техника особенно полезна там, где модель должна не просто знать факты, а ещё и правильно использовать их в нужном формате ответа.

Коротко

DSP работает так:

  1. показать примеры;
  2. дать evidence;
  3. попросить prediction.
ПромптGPT-5
Используй DSP: сначала посмотри на 2 примера того, как отвечать на вопросы по документации, затем используй retrieved snippets и только после этого дай финальный ответ.
Ответ модели

Модель сначала подхватила стиль ответа из demonstrations, затем опёрлась на найденные snippets и выдала более grounded и форматно стабильный ответ, чем при retrieval-only подходе.

DSP полезен там, где важны и знание, и правильная форма reasoning/output.

Почему retrieval-only часто недостаточен

Если вы просто кладёте документы в контекст, модель знает, на что опираться, но не всегда знает, как именно это делать:

  • как структурировать ответ;
  • как выбирать между competing snippets;
  • как оформлять rationale;
  • как соответствовать task-specific conventions.

DSP добавляет demonstrations как поведенческую рамку. Модель видит не только факты, но и pattern использования фактов.

Когда техника особенно полезна

DSP хорошо работает для:

  • knowledge-intensive QA;
  • extraction with evidence;
  • document-grounded classification;
  • support answers by docs;
  • tasks, где важны both grounding and output discipline.

Это особенно полезно для внутренних copilots, где нужны не просто знания, а repeatable answer style.

Только search + answer
Модель видит snippets, но не всегда понимает, как именно на их основе строить итоговый ответ в нужном формате.
DSP
Модель сначала получает demonstrations нужного поведения, затем evidence, и отвечает уже по сочетанию 'как делать' и 'на чём опираться'.

Почему demonstrations и retrieval усиливают друг друга

Few-shot examples без retrieval могут быть format-strong, но knowledge-weak.

Retrieval без demonstrations может быть knowledge-strong, но behavior-weak.

DSP полезен именно потому, что объединяет:

  • task behavior from demonstrations;
  • factual grounding from search.

На практике это нередко даёт более ровный результат, чем reliance only on one of the two.

Ограничения

Техника может раздувать контекст. Если demonstrations и evidence занимают слишком много места, prompt становится тяжёлым и noisy. Кроме того, слабые demonstrations могут навредить сильнее, чем помочь.

Поэтому DSP требует дисциплины:

  • few good examples;
  • компактное evidence;
  • ясный output contract.

Как понимать DSP в 2026

Сегодня DSP полезно видеть как precursor to modern retrieval workflows. Во многих production-системах по сути живёт его дух:

  • example-driven behavior;
  • retrieval-driven grounding;
  • final prediction under explicit contract.

Это особенно ценно там, где хочется улучшить качество без полной агентной оркестрации.

Техническая реализация

const prompt = [
  demonstrationsBlock,
  evidenceBlock,
  `Question: ${query}`,
  outputContract,
].join('\n\n')

Практический совет: demonstrations и retrieved evidence лучше хранить как разные блоки. Это помогает тестировать, что именно дало выигрыш: examples, retrieval или их комбинация.

Проверьте себя

1. Что означает DSP?

2. Почему DSP бывает полезнее retrieval-only?

3. Главный риск DSP?