P

Polish Reranker Large Ranknet

由sdadas開發
這是一個採用RankNet損失函數訓練的波蘭文本排序模型,訓練數據集包含140萬條查詢和1000萬份文檔組成的文本對。
下載量 337
發布時間 : 2/3/2024

模型概述

該模型主要用於波蘭語文本的排序和重排任務,能夠評估查詢與文檔的相關性並進行排序。

模型特點

高效訓練方法
採用RankNet損失函數訓練,基於查詢和文檔對計算損失,而非獨立處理查詢-文檔對
優異性能表現
在波蘭信息檢索基準測試中表現優於教師模型,儘管參數量僅為教師模型的1/30,推理速度快33倍
多樣化訓練數據
訓練數據包含波蘭語MS MARCO訓練集、翻譯為波蘭語的ELI5數據集和波蘭語醫療問答集

模型能力

文本相關性評估
查詢-文檔排序
信息檢索結果重排

使用案例

信息檢索
搜索引擎結果優化
對搜索引擎返回的結果進行重排,提高最相關結果的排名
在波蘭信息檢索基準測試中NDCG@10達到62.65
問答系統
問答相關性排序
對問答系統返回的多個答案進行相關性排序
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase