B

Bi Encoder Msmarco Bert Base German

由PM-AI開發
基於德語版MSMARCO數據集訓練的語義搜索模型,採用困難負樣本和Margin MSE損失函數優化
下載量 20.53k
發布時間 : 11/23/2022

模型概述

該模型專為德語語義搜索和文檔檢索設計,能夠根據查詢找到相關段落。基於機器翻譯的德語MSMARCO數據集訓練,結合先進訓練技術實現高效檢索。

模型特點

困難負樣本訓練
採用多系統檢索結果作為負樣本,提升模型區分相關段落的能力
Margin MSE損失函數
通過交叉編碼器指導雙編碼器訓練,優化相似度間距計算
非對稱搜索優化
專門針對查詢-段落非對稱搜索場景進行優化
跨領域適用性
基於MSMARCO多領域數據訓練,適應不同領域的檢索需求

模型能力

語義搜索
段落檢索
查詢-段落匹配
跨領域信息檢索

使用案例

信息檢索
問答系統
根據用戶問題檢索最相關的答案段落
在germandpr-beir測試集上NDCG@10達0.7196
文檔搜索
從大型文檔庫中定位相關內容
優於傳統BM25算法約34%
企業應用
知識庫檢索
在企業知識庫中快速定位相關信息
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase