O

Opensearch Neural Sparse Encoding Multilingual V1

Developed by opensearch-project
一个支持15种语言的学习型稀疏检索模型,专为OpenSearch设计,无需推理即可实现高效检索
Downloads 121
Release Time : 2/21/2025

Model Overview

该模型将文档编码为105879维稀疏向量,通过词元权重实现高效检索,支持OpenSearch神经稀疏特性

Model Features

无需推理检索
检索时仅需使用分词器和权重查找表生成稀疏向量,无需完整模型推理
多语言支持
支持15种语言的跨语言文档检索
高效稀疏编码
将文档编码为105879维稀疏向量,优化检索效率
OpenSearch集成
专为OpenSearch设计,支持通过Lucene倒排索引实现学习型稀疏检索

Model Capabilities

多语言文档检索
稀疏向量生成
高效相似度计算
跨语言搜索

Use Cases

信息检索
多语言文档搜索
在多语言文档库中实现高效检索
在MIRACL基准测试中平均NDCG@10达到0.629
企业搜索
用于企业内部多语言文档的搜索系统
相比传统BM25方法有显著提升
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase