M

Mmlw Retrieval E5 Base

由sdadas開發
MMLW(我必須得到更好的消息)是波蘭語的神經文本編碼器,針對信息檢索任務進行了優化,能夠將查詢和段落轉換為768維向量。
下載量 144
發布時間 : 10/18/2023

模型概述

該模型是一個波蘭語的句子轉換器,主要用於特徵提取和句子相似度計算,特別適用於信息檢索任務。

模型特點

多語言知識蒸餾
使用多語言知識蒸餾方法訓練,利用英語FlagEmbeddings作為教師模型
對比損失微調
在波蘭MS MARCO訓練集上使用對比損失進行微調,採用大批量大小訓練
特定前綴處理
查詢需要添加'query:'前綴,段落需要添加'passage:'前綴以獲得最佳效果

模型能力

文本編碼
句子相似度計算
信息檢索

使用案例

信息檢索
問答系統
用於匹配用戶查詢與相關答案段落
能夠準確找到與查詢最相關的答案
文檔檢索
在大量文檔中查找與特定查詢最相關的文檔
在波蘭信息檢索基準測試中NDCG@10達到56.09
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase