O

Opensearch Neural Sparse Encoding Doc V3 Distill

opensearch-projectによって開発
OpenSearch向けに設計されたドキュメントレベルの学習型スパース検索モデルで、蒸留技術で最適化され、効率的なドキュメント検索をサポート
ダウンロード数 243
リリース時間 : 3/28/2025

モデル概要

このモデルはドキュメントを30522次元のスパースベクトルにエンコードでき、ドキュメント検索タスクに適しており、特にOpenSearchでの検索効率を最適化

モデル特徴

推論不要検索
ドキュメント処理に推論計算が不要で、直接スパースベクトルを生成し、計算コストを大幅に削減
効率的検索
平均FLOPSはわずか1.8で、前世代モデルに比べて効率が大幅に向上
関連性改善
BEIRベンチマークテストで平均NDCG@10が0.517を達成し、前世代のドキュメント専用モデルを上回る
大規模トレーニング
MS MARCO、WikiAnswersなど、さまざまなQAおよびドキュメントデータセットを統合してトレーニング

モデル能力

ドキュメント検索
スパースベクトル生成
意味マッチング
クロスドメイン検索

使用事例

検索エンジン
OpenSearchドキュメント検索
OpenSearchのニューラルスパース検索コンポーネントとして、効率的なドキュメント検索機能を提供
従来の検索方法に比べてより良い意味マッチング効果を提供
QAシステム
QAペア検索
ナレッジベースからユーザーの質問に最も関連するQAペアを検索
NQなどのQAデータセットで良好なパフォーマンス
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase