R

Ruri Large

由cl-nagoya開發
Ruri-Large 是一個專注於日語文本相似度計算的高性能嵌入模型,基於 transformer 架構,支持長文本處理(最大長度8192)。
下載量 6,784
發布時間 : 8/28/2024

模型概述

該模型主要用於日語文本的語義相似度計算和特徵提取,在JMTEB基準測試中表現出色。特別優化了查詢和段落文本的區分能力,需在輸入前添加'クエリ:'或'文章:'前綴。

模型特點

高性能日語處理
在JMTEB基準測試中平均得分73.31,優於同類日語嵌入模型
長文本支持
支持最大8192長度的文本處理,適合長文檔分析
查詢/段落區分
通過前綴標記區分查詢文本和段落文本,優化檢索效果

模型能力

日語文本嵌入
語義相似度計算
文本特徵提取
信息檢索
文本聚類

使用案例

信息檢索
問答系統
通過計算查詢與知識庫段落的相似度實現精準問答
在JMTEB檢索任務中獲得73.02分
內容分析
文本聚類
對大量日語文本進行語義聚類分析
在JMTEB聚類任務中獲得51.82分
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase