G

Glucose Base Ja V2

由pkshatech開發
通用日語文本嵌入模型,專為檢索任務優化,在CPU上運行表現優異
下載量 25.25k
發布時間 : 8/22/2024

模型概述

一款專注於日語文本處理的通用嵌入模型,特別擅長檢索任務和句子相似度計算,可作為基於查詢的段落檢索系統使用

模型特點

檢索任務優化
在MIRACL等檢索任務中展現同尺寸模型中的最高性能
日語專用優化
專門針對日語文本處理進行優化訓練
輕量高效
支持CPU運行,適合資源有限的環境
多階段訓練
通過集成蒸餾和多階段對比學習進行微調

模型能力

句子相似度計算
語義檢索
特徵提取
段落檢索

使用案例

信息檢索
企業知識庫檢索
用於企業內部知識庫的語義檢索系統
在MIRACL-ja數據集上達到85.5的Recall@5
問答系統
構建基於檢索的問答系統
在JQaRA數據集上達到60.6的nDCG@10
文本分析
文本聚類
對日語文本進行語義聚類分析
語義相似度計算
計算句子間的語義相似度
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase