B

Biencoder Mminilmv2 L12 Mmarcofr

由antoinelouis開發
這是一個用於法語的密集單向量雙編碼器模型,可用於語義搜索。該模型將查詢和段落映射到384維密集向量,通過餘弦相似度計算相關性。
下載量 346
發布時間 : 5/22/2023

模型概述

該模型是一個基於mMiniLMv2架構的雙編碼器模型,專門針對法語文本的語義搜索任務進行優化。它能夠將查詢和段落編碼為384維的密集向量,並通過計算餘弦相似度來衡量它們之間的相關性。

模型特點

法語優化
專門針對法語文本進行訓練和優化,在法語語義搜索任務上表現優異
高效檢索
使用密集向量表示,實現高效的語義相似度計算和段落檢索
高質量負樣本
訓練時使用了從12個不同密集檢索器中挖掘的困難負樣本,提高了模型區分能力

模型能力

法語文本嵌入
語義相似度計算
段落檢索
信息檢索

使用案例

信息檢索
法語文檔檢索
在法語文檔集合中檢索與查詢最相關的段落
在mMARCO-fr驗證集上達到84.4%的Recall@500
問答系統
構建法語問答系統的檢索組件
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase