O

Opensearch Neural Sparse Encoding V1

Developed by opensearch-project
OpenSearch神經稀疏編碼模型v1,用於將查詢和文檔編碼為30522維稀疏向量,實現高效的搜索相關性和檢索
Downloads 10.20k
Release Time : 3/7/2024

Model Overview

這是一個學習型稀疏檢索模型,可將查詢和文檔編碼為30522維的稀疏向量,在搜索相關性和檢索效率方面表現出色。模型在MS MARCO數據集上進行訓練,支持使用Lucene倒排索引進行學習型稀疏檢索。

Model Features

高效稀疏編碼
將查詢和文檔編碼為30522維的稀疏向量,非零維度索引表示詞彙表中對應的標記,權重表示標記的重要性
優秀的相關性表現
在BEIR基準測試的多個數據集上表現出色,平均NDCG@10達到0.524
OpenSearch集成
專為OpenSearch集群設計,支持使用Lucene倒排索引進行高效檢索
零樣本性能
在未見過的數據集上也能表現良好,無需微調即可使用

Model Capabilities

文本稀疏編碼
信息檢索
查詢-文檔匹配
零樣本遷移學習

Use Cases

搜索引擎
文檔檢索
在大型文檔集合中高效檢索相關文檔
在BEIR基準測試中平均NDCG@10達到0.524
問答系統
匹配用戶問題與候選答案
在NQ數據集上NDCG@10達到0.553
專業領域搜索
科學文獻檢索
在科學文獻數據庫中檢索相關論文
在SciFact數據集上NDCG@10達到0.723
醫療信息檢索
檢索醫療相關文檔和信息
在TrecCovid數據集上NDCG@10達到0.771
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase