R

Ruri Large V2

Developed by cl-nagoya
Ruri是一个日语通用文本嵌入模型,专注于句子相似度计算和特征提取,支持长文本处理。
Downloads 3,672
Release Time : 12/6/2024

Model Overview

该模型主要用于日语句子相似度计算和文本特征提取,能够生成高质量的文本嵌入表示,适用于信息检索、聚类分析等任务。

Model Features

长文本支持
最大支持512个标记的序列长度,适合处理较长文本
高性能
在JMTEB基准测试中表现优异,平均得分74.55
前缀感知
能够区分查询文本和段落文本,通过特定前缀优化相似度计算

Model Capabilities

日语句子相似度计算
文本特征提取
信息检索
文本聚类
语义搜索

Use Cases

信息检索
问答系统
用于查找与用户查询最相关的答案段落
在重排序任务中达到93.21的高分
文本分析
文档聚类
将语义相似的文档自动分组
在聚类任务中得分52.14
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase