Mr. TyDi важен как benchmark для dense retrieval в non-English settings. Он хорошо показывает, что dense retrieval tricks, работающие в English, далеко не всегда так же хорошо работают на других языках, особенно typologically diverse и lower-resource ones.
В 2026 Mr. TyDi остаётся полезным именно как компактный и понятный multilingual dense retrieval benchmark. Он уже не самый широкий, но всё ещё отлично ловит пробелы в cross-lingual generalization.
MIRACL шире, а Mr. TyDi делает акцент на конкретной dense retrieval problem:
Из-за этого benchmark особенно полезен для быстрого dense retrieval diagnostics.
Mr. TyDi хорошо подходит для:
Если нужен very broad multilingual benchmark with more languages and tasks, MIRACL может быть полезнее.
Хотя MIRACL шире, Mr. TyDi остаётся ценным именно как focused benchmark для dense retrieval. Его сила в том, что он не пытается быть всем сразу:
Поэтому Mr. TyDi особенно полезен в ранней диагностике. Если dense model плохо выглядит уже здесь, обычно нет смысла сразу интерпретировать более широкий multilingual story. Сначала нужно понять, выдерживает ли retriever базовый перенос на разные языковые структуры.
Mr. TyDi хорош, но:
Нужно помнить и о том, что Mr. TyDi оценивает mostly mono-lingual retrieval. Если реальный продукт живёт в cross-lingual режиме, где запрос и документы часто на разных языках, потребуется отдельный слой evals.
Поэтому его лучше использовать как targeted dense retrieval benchmark.
Даже сейчас многие dense retrieval models остаются English-first по факту, а не по обещанию. Mr. TyDi важен потому, что быстро и честно показывает этот разрыв.
Это делает его отличным compact benchmark-ом для multilingual dense retrieval teams.