M

Msmarco MiniLM L12 En De V1

cross-encoderによって開発
MS Marcoの段落ランキングタスクを基に訓練された英独多言語クロスエンコーダモデルで、情報検索シーンの段落再ランキングに適しています。
ダウンロード数 19.62k
リリース時間 : 3/2/2022

モデル概要

このモデルは段落の再ランキングに使用される英独多言語クロスエンコーダで、MS Marcoの段落ランキングタスクを基に訓練され、英語とドイツ語の情報検索シーンをサポートします。

モデル特徴

多言語サポート
英語とドイツ語のバイリンガル情報検索と段落再ランキングをサポートします。
高性能な再ランキング
TREC - DL19やGermanDPRなどのベンチマークテストで優れた性能を発揮し、BM25ベースラインを大幅に上回ります。
効率的な推論
V100 GPUでは1秒間に900ペアの(クエリ、ドキュメント)を処理でき、大規模検索シーンに適しています。

モデル能力

テキストランキング
多言語情報検索
段落の再ランキング

使用事例

情報検索
検索エンジン結果の再ランキング
BM25などの従来の検索方法で返された結果を意味的に再ランキングし、結果の関連性を向上させます。
TREC - DL19の英英検索でNDCG@10が72.94に達し、BM25の45.46を大幅に上回ります。
多言語検索
ドイツ語のクエリで英語のドキュメントを検索してランキング付けすること、またはその逆をサポートします。
TREC - DL19の独英検索でNDCG@10が66.07に達します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase