R

Ruri Large V2

由cl-nagoya開發
Ruri是一個日語通用文本嵌入模型,專注於句子相似度計算和特徵提取,支持長文本處理。
下載量 3,672
發布時間 : 12/6/2024

模型概述

該模型主要用於日語句子相似度計算和文本特徵提取,能夠生成高質量的文本嵌入表示,適用於信息檢索、聚類分析等任務。

模型特點

長文本支持
最大支持512個標記的序列長度,適合處理較長文本
高性能
在JMTEB基準測試中表現優異,平均得分74.55
前綴感知
能夠區分查詢文本和段落文本,通過特定前綴優化相似度計算

模型能力

日語句子相似度計算
文本特徵提取
信息檢索
文本聚類
語義搜索

使用案例

信息檢索
問答系統
用於查找與用戶查詢最相關的答案段落
在重排序任務中達到93.21的高分
文本分析
文檔聚類
將語義相似的文檔自動分組
在聚類任務中得分52.14
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase