O

Opensearch Neural Sparse Encoding Multilingual V1

由opensearch-project開發
一個支持15種語言的學習型稀疏檢索模型,專為OpenSearch設計,無需推理即可實現高效檢索
下載量 121
發布時間 : 2/21/2025

模型概述

該模型將文檔編碼為105879維稀疏向量,通過詞元權重實現高效檢索,支持OpenSearch神經稀疏特性

模型特點

無需推理檢索
檢索時僅需使用分詞器和權重查找表生成稀疏向量,無需完整模型推理
多語言支持
支持15種語言的跨語言文檔檢索
高效稀疏編碼
將文檔編碼為105879維稀疏向量,優化檢索效率
OpenSearch集成
專為OpenSearch設計,支持通過Lucene倒排索引實現學習型稀疏檢索

模型能力

多語言文檔檢索
稀疏向量生成
高效相似度計算
跨語言搜索

使用案例

信息檢索
多語言文檔搜索
在多語言文檔庫中實現高效檢索
在MIRACL基準測試中平均NDCG@10達到0.629
企業搜索
用於企業內部多語言文檔的搜索系統
相比傳統BM25方法有顯著提升
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase