O

Opensearch Neural Sparse Encoding V2 Distill

opensearch-projectによって開発
OpenSearchニューラルスパースエンコーディングモデルv2蒸留版は、OpenSearch向けに設計された効率的な学習型スパース検索モデルで、クエリとドキュメントを30522次元のスパースベクトルにエンコードできます。
ダウンロード数 4,964
リリース時間 : 7/17/2024

モデル概要

このモデルは主に検索タスクに使用され、クエリとドキュメントをスパースベクトルに変換し、Lucene転置インデックスに基づくスパース検索をサポートし、さまざまな情報検索シナリオに適用できます。

モデル特徴

効率的なスパース検索
Lucene転置インデックスに基づくスパース検索をサポートし、検索効率を向上させます。
蒸留版最適化
基本版モデルと比較して、パラメータ数を半分に削減しながら、性能を維持または向上させます。
複数データセット学習
トレーニングデータにはMS MARCO、eli5質問応答、squad質問応答ペアなど14の公開データセットが含まれます。
意味的関連マッチング
元のテキストに重複する単語がなくても、モデルは意味的関連性を通じて効果的なマッチングを実現できます。

モデル能力

テキスト検索
クエリ拡張
ドキュメント拡張
意味的マッチング

使用事例

情報検索
ドキュメント検索
大規模なドキュメントライブラリから関連ドキュメントを迅速に検索します。
BEIRベンチマークサブセットで平均NDCG@10が0.528を達成
質問応答システム
質問応答システムでの関連段落検索に使用されます。
NQ(自然質問応答)データセットでNDCG@10が0.561を達成
検索エンジン
OpenSearch統合
OpenSearchのニューラルスパース検索機能の中核コンポーネントとして機能します。
Lucene転置インデックスに基づく効率的な検索をサポート
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase