R

Ruri V3 Pt 30m

由cl-nagoya開發
Ruri是基於ModernBERT-Ja構建的日語通用文本嵌入模型,提供不同參數規模的版本,適用於多種文本處理任務。
下載量 250
發布時間 : 3/20/2025

模型概述

Ruri是一個日語通用文本嵌入模型,主要用於句子相似度計算和特徵提取。它基於ModernBERT-Ja架構,支持多種文本類型的前綴區分。

模型特點

多參數規模版本
提供從30M到310M不同參數規模的模型版本,滿足不同計算資源需求
1+3前綴方案
採用特殊前綴區分文本類型:空字符串用於語義編碼,'トピック:'用於分類/聚類,'検索クエリ:'用於檢索查詢,'検索文書:'用於待檢索文檔
高性能表現
在JMTEB基準測試中取得74.51到77.24的平均分(不同規模版本)

模型能力

句子相似度計算
文本特徵提取
語義編碼
分類/聚類編碼
檢索查詢編碼
文檔檢索編碼

使用案例

信息檢索
文檔檢索
使用'検索クエリ:'和'検索文書:'前綴編碼查詢和文檔,實現高效檢索
文本分析
主題分類
使用'トピック:'前綴對文本進行主題編碼
語義相似度計算
比較不同文本的嵌入向量計算語義相似度
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase