B

Biencoder Distilcamembert Mmarcofr

由antoinelouis開發
這是一個用於法語的密集單向量雙編碼器模型,可用於語義搜索。該模型將查詢和段落映射到768維密集向量,通過餘弦相似度計算相關性。
下載量 160
發布時間 : 5/22/2023

模型概述

該模型是基於DistilCamemBERT的雙編碼器模型,專門針對法語信息檢索任務優化,能夠高效計算查詢與段落之間的語義相似度。

模型特點

法語優化
專門針對法語文本優化的語義檢索模型
高效檢索
採用768維密集向量表示,支持快速餘弦相似度計算
難負樣本挖掘
訓練時使用了12個不同檢索器挖掘的難負樣本

模型能力

語義相似度計算
段落檢索
信息檢索

使用案例

信息檢索
文檔檢索系統
構建法語文檔檢索系統,根據用戶查詢返回最相關文檔
在mMARCO-fr驗證集上Recall@500達到87.9
問答系統
作為問答系統的檢索組件,從知識庫中查找相關段落
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase