B

Bce Reranker Base V1

由 maidalun1020 开发
面向RAG优化的双语与跨语言重排序模型,支持中英日韩四语种,提供可解释的绝对分数
下载量 68.29k
发布时间 : 12/29/2023

模型简介

BCEmbedding是网易有道开发的双语与跨语言嵌入模型,包含生成语义向量的EmbeddingModel和优化搜索结果的RerankerModel。作为有道RAG技术栈的核心组件,已应用于QAnything等开源项目及有道产品。

模型特点

跨语言能力
支持中英日韩四语种及跨语种检索,基于有道翻译引擎优化
RAG专项优化
针对教育、法律、金融等多领域真实场景优化,适配问答、摘要等任务
长文本处理
突破512字符限制,支持长文本重排序
可解释评分
提供绝对质量分数(建议低质量段落过滤阈值为0.35-0.4)
两阶段检索
结合bce-embedding-base_v1召回与bce-reranker-base_v1精排的最佳实践方案

模型能力

跨语言语义匹配
文本相关性评分
低质量内容过滤
长文本处理
多领域适配

使用案例

检索增强生成(RAG)
教育领域问答
教材内容检索与答案生成
在LlamaIndex RAG评估中表现优异
多语言文档处理
中英日韩混合文档的语义检索
跨语言场景评估领先
信息过滤
低质量内容识别
通过绝对分数阈值过滤无关文本片段
建议阈值为0.35-0.4
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase