O

Opensearch Neural Sparse Encoding V2 Distill

由opensearch-project開發
OpenSearch神經稀疏編碼模型v2蒸餾版是一個高效的學習型稀疏檢索模型,專為OpenSearch設計,能夠將查詢和文檔編碼為30522維稀疏向量。
下載量 4,964
發布時間 : 7/17/2024

模型概述

該模型主要用於檢索任務,能夠將查詢和文檔轉換為稀疏向量,支持基於Lucene倒排索引的稀疏檢索,適用於多種信息檢索場景。

模型特點

高效稀疏檢索
支持基於Lucene倒排索引的稀疏檢索,提高檢索效率。
蒸餾版優化
相比基礎版模型,參數量減少一半,同時保持或提升性能。
多數據集訓練
訓練數據包含MS MARCO、eli5問答、squad問答對等14個公開數據集。
語義關聯匹配
即使原始文本無重疊詞,模型仍能通過語義關聯實現有效匹配。

模型能力

文本檢索
查詢擴展
文檔擴展
語義匹配

使用案例

信息檢索
文檔檢索
在大型文檔庫中快速檢索相關文檔。
在BEIR基準測試子集上平均NDCG@10達到0.528
問答系統
用於問答系統中的相關段落檢索。
在NQ(自然問答)數據集上NDCG@10達到0.561
搜索引擎
OpenSearch集成
作為OpenSearch的神經稀疏檢索功能的核心組件。
支持基於Lucene倒排索引的高效檢索
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase