B

Bloomz 560m Retriever V2

由cmarkea開發
基於Bloomz-560m-dpo-chat模型的雙編碼器,用於將文章和查詢映射到同一向量空間,支持法語和英語的跨語言檢索。
下載量 17
發布時間 : 5/26/2024

模型概述

該模型是一個雙編碼器,專門設計用於開放域問答(ODQA)任務,能夠將查詢和相關文章映射到同一向量空間,確保查詢與相關文章的鄰近性。支持法語和英語的跨語言檢索。

模型特點

跨語言檢索
支持法語和英語的跨語言檢索,無論文章是法語還是英語,任一語言的查詢都能找到相關文章。
高效檢索
採用餘弦距離作為度量標準,顯著提升檢索效率。
對比學習訓練
使用改進版mMARCO數據集進行對比學習訓練,過濾假陰性樣本並採用困難負樣本策略。

模型能力

特徵提取
跨語言檢索
開放域問答

使用案例

信息檢索
開放域問答
用於開放域問答系統,快速檢索相關文章以回答問題。
在SQuAD測試集上表現優異,Top-1準確率達68%(法/法)和66.6%(英/法)。
跨語言文檔檢索
支持法語和英語之間的跨語言文檔檢索。
在跨語言檢索任務中表現優於傳統BM25和CamemBERT等模型。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase