B

Biencoder Electra Base Mmarcofr

由antoinelouis開發
這是一個用於法語的密集單向量雙編碼器模型,可用於語義搜索。該模型將查詢和段落映射到768維密集向量,通過餘弦相似度計算相關性。
下載量 31
發布時間 : 5/22/2023

模型概述

該模型是基於ELECTRA架構的法語句子相似度模型,專門用於段落檢索任務,能夠高效計算查詢與段落之間的語義相關性。

模型特點

法語優化
專門針對法語文本進行優化,基於法語ELECTRA模型和mMARCO數據集訓練
高效檢索
採用單向量雙編碼器架構,實現高效的語義搜索和段落檢索
硬負樣本訓練
使用從多個密集檢索器中挖掘的硬負樣本進行訓練,提高模型區分能力

模型能力

法語句子嵌入
語義相似度計算
段落檢索
信息檢索

使用案例

信息檢索
文檔檢索系統
構建法語文檔檢索系統,根據用戶查詢返回最相關的文檔段落
在mMARCO-fr驗證集上Recall@500達到81.6%
問答系統
作為問答系統的檢索組件,快速找到與問題相關的候選答案段落
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase