B

Bce Reranker Base V1

由maidalun1020開發
面向RAG優化的雙語與跨語言重排序模型,支持中英日韓四語種,提供可解釋的絕對分數
下載量 68.29k
發布時間 : 12/29/2023

模型概述

BCEmbedding是網易有道開發的雙語與跨語言嵌入模型,包含生成語義向量的EmbeddingModel和優化搜索結果的RerankerModel。作為有道RAG技術棧的核心組件,已應用於QAnything等開源項目及有道產品。

模型特點

跨語言能力
支持中英日韓四語種及跨語種檢索,基於有道翻譯引擎優化
RAG專項優化
針對教育、法律、金融等多領域真實場景優化,適配問答、摘要等任務
長文本處理
突破512字符限制,支持長文本重排序
可解釋評分
提供絕對質量分數(建議低質量段落過濾閾值為0.35-0.4)
兩階段檢索
結合bce-embedding-base_v1召回與bce-reranker-base_v1精排的最佳實踐方案

模型能力

跨語言語義匹配
文本相關性評分
低質量內容過濾
長文本處理
多領域適配

使用案例

檢索增強生成(RAG)
教育領域問答
教材內容檢索與答案生成
在LlamaIndex RAG評估中表現優異
多語言文檔處理
中英日韓混合文檔的語義檢索
跨語言場景評估領先
信息過濾
低質量內容識別
通過絕對分數閾值過濾無關文本片段
建議閾值為0.35-0.4
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase