O

Opensearch Neural Sparse Encoding V1

opensearch-projectによって開発
OpenSearchニューラル疎符号化モデルv1。クエリとドキュメントを30522次元の疎ベクトルにエンコードし、効率的な検索関連性と検索を実現します。
ダウンロード数 10.20k
リリース時間 : 3/7/2024

モデル概要

これは学習型の疎検索モデルで、クエリとドキュメントを30522次元の疎ベクトルにエンコードし、検索関連性と検索効率の面で優れた性能を発揮します。モデルはMS MARCOデータセットで学習され、Lucene転置索引を使用した学習型疎検索をサポートしています。

モデル特徴

効率的な疎符号化
クエリとドキュメントを30522次元の疎ベクトルにエンコードし、非ゼロ次元のインデックスは語彙表内の対応するトークンを表し、重みはトークンの重要度を表します。
優れた関連性の性能
BEIRベンチマークテストの複数のデータセットで優れた性能を発揮し、平均NDCG@10が0.524に達します。
OpenSearch統合
OpenSearchクラスタ用に設計され、Lucene転置索引を使用した効率的な検索をサポートします。
ゼロサンプル性能
未見のデータセットでも良好な性能を発揮し、微調整なしで使用できます。

モデル能力

テキスト疎符号化
情報検索
クエリ - ドキュメントマッチング
ゼロサンプル転移学習

使用事例

検索エンジン
ドキュメント検索
大規模なドキュメント集合から関連するドキュメントを効率的に検索します。
BEIRベンチマークテストで平均NDCG@10が0.524に達します。
質問応答システム
ユーザーの質問と候補回答をマッチングします。
NQデータセットでNDCG@10が0.553に達します。
専門分野検索
科学文献検索
科学文献データベースから関連する論文を検索します。
SciFactデータセットでNDCG@10が0.723に達します。
医療情報検索
医療関連のドキュメントと情報を検索します。
TrecCovidデータセットでNDCG@10が0.771に達します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase