O

Opensearch Neural Sparse Encoding Doc V3 Distill

由opensearch-project開發
專為OpenSearch設計的文檔級學習型稀疏檢索模型,採用蒸餾技術優化,支持高效文檔檢索
下載量 243
發布時間 : 3/28/2025

模型概述

該模型可將文檔編碼為30522維稀疏向量,適用於文檔檢索任務,特別優化了在OpenSearch中的檢索效率

模型特點

免推理檢索
文檔處理無需推理計算,直接生成稀疏向量,顯著降低計算成本
高效檢索
平均FLOPS僅1.8,相比前代模型顯著提升效率
改進相關性
在BEIR基準測試上平均NDCG@10達到0.517,優於前代文檔專用模型
大規模訓練
融合多種問答和文檔數據集訓練,包括MS MARCO、WikiAnswers等

模型能力

文檔檢索
稀疏向量生成
語義匹配
跨領域檢索

使用案例

搜索引擎
OpenSearch文檔檢索
作為OpenSearch的神經稀疏檢索組件,提供高效的文檔搜索能力
相比傳統檢索方法提供更好的語義匹配效果
問答系統
問答對檢索
從知識庫中檢索與用戶問題最相關的問答對
在NQ等問答數據集上表現良好
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase