J

Jacolbert

由bclavie開發
JaColBERT是基於ColBERT的首個日語專用文檔檢索模型,具有強大的域外泛化能力。
下載量 859
發布時間 : 12/25/2023

模型概述

JaColBERT是首個基於ColBERT的日語專用文檔檢索模型,通過將文檔表示為嵌入向量集合,以較低計算成本獲得卓越性能和強大的域外泛化能力。

模型特點

強大的域外泛化能力
儘管在評估數據集上屬於域外數據,JaColBERT仍超越了先前常用的日語文檔檢索模型,並接近多語言模型的性能。
高效訓練
僅基於單一數據集的1000萬組三元組訓練而成,所需數據量遠少於稠密嵌入模型。
計算效率高
通過將文檔表示為嵌入向量集合,以遠低於交叉編碼器的計算成本獲得卓越性能。

模型能力

日語文檔檢索
句子相似度計算
語義搜索

使用案例

信息檢索
問答系統
用於構建日語問答系統,快速檢索相關文檔回答問題。
在JSQuAD數據集上R@1達到0.906
文檔搜索
用於日語文檔的語義搜索,提高搜索相關性。
在MIRACL和MrTyDi數據集上表現優異
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase