R

Ruri Small

Developed by cl-nagoya
Ruri是一个专注于日语文本嵌入的模型,能够高效计算句子相似度和提取文本特征。
Downloads 11.75k
Release Time : 8/28/2024

Model Overview

该模型是一个日语通用文本嵌入模型,主要用于句子相似度计算和特征提取。基于DistilBert架构,支持512个标记的最大序列长度,输出维度为768。

Model Features

高效日语处理
专门针对日语文本优化,能准确理解日语语义特征
高性能
在JMTEB评估中表现优异,超越同类模型
轻量化
仅68M参数的小型模型,适合资源有限的环境
长文本支持
支持最大512个标记的序列长度

Model Capabilities

日语文本特征提取
句子相似度计算
语义搜索
文本聚类

Use Cases

信息检索
语义搜索
根据查询语义查找相关文档
在JMTEB检索任务中获得69.41分
文本分析
文本聚类
将语义相似的文本分组
在JMTEB聚类任务中获得51.19分
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase