DSP, или Demonstrate-Search-Predict, это техника, в которой модель работает в трёх последовательных режимах. Сначала она получает demonstrations того, как выглядит нужная задача, затем получает retrieved evidence, и только после этого делает prediction. То есть few-shot learning и retrieval здесь не конкурируют, а складываются в один pipeline.
В 2026 этот паттерн важен как хороший reminder: для knowledge-heavy задач полезно давать модели не только внешние факты, но и формат поведения. Retrieval отвечает за знание, demonstrations — за способ использования этого знания.
Если вы просто кладёте документы в контекст, модель знает, на что опираться, но не всегда знает, как именно это делать:
DSP добавляет demonstrations как поведенческую рамку. Модель видит не только факты, но и pattern использования фактов.
DSP хорошо работает для:
Это особенно полезно для внутренних copilots, где нужны не просто знания, а repeatable answer style.
Few-shot examples без retrieval могут быть format-strong, но knowledge-weak.
Retrieval без demonstrations может быть knowledge-strong, но behavior-weak.
DSP полезен именно потому, что объединяет:
На практике это нередко даёт более ровный результат, чем reliance only on one of the two.
Техника может раздувать контекст. Если demonstrations и evidence занимают слишком много места, prompt становится тяжёлым и noisy. Кроме того, слабые demonstrations могут навредить сильнее, чем помочь.
Поэтому DSP требует дисциплины:
Сегодня DSP полезно видеть как precursor to modern retrieval workflows. Во многих production-системах по сути живёт его дух:
Это особенно ценно там, где хочется улучшить качество без полной агентной оркестрации.