O

Opensearch Neural Sparse Encoding Doc V3 Distill

由 opensearch-project 开发
专为OpenSearch设计的文档级学习型稀疏检索模型,采用蒸馏技术优化,支持高效文档检索
下载量 243
发布时间 : 3/28/2025

模型简介

该模型可将文档编码为30522维稀疏向量,适用于文档检索任务,特别优化了在OpenSearch中的检索效率

模型特点

免推理检索
文档处理无需推理计算,直接生成稀疏向量,显著降低计算成本
高效检索
平均FLOPS仅1.8,相比前代模型显著提升效率
改进相关性
在BEIR基准测试上平均NDCG@10达到0.517,优于前代文档专用模型
大规模训练
融合多种问答和文档数据集训练,包括MS MARCO、WikiAnswers等

模型能力

文档检索
稀疏向量生成
语义匹配
跨领域检索

使用案例

搜索引擎
OpenSearch文档检索
作为OpenSearch的神经稀疏检索组件,提供高效的文档搜索能力
相比传统检索方法提供更好的语义匹配效果
问答系统
问答对检索
从知识库中检索与用户问题最相关的问答对
在NQ等问答数据集上表现良好
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase