R

Ruri Base

Developed by cl-nagoya
Ruriは日本語に特化した汎用テキスト埋め込みモデルで、文の類似度計算と特徴抽出タスクに焦点を当てています。
Downloads 523.56k
Release Time : 8/28/2024

Model Overview

RuriはBERTアーキテクチャを基にした日本語テキスト埋め込みモデルで、主に文の類似度計算とテキスト特徴抽出に使用されます。クエリや段落テキストの前に特定の接頭辞を追加することで、より良い効果が得られます。

Model Features

日本語最適化
日本語テキストに特化して最適化されており、日本語タスクで優れた性能を発揮します
長文対応
最大512トークンのシーケンス長をサポートし、比較的長いテキストを処理できます
高性能
JMTEBベンチマークテストで他の日本語モデルよりも優れた性能を示しています
接頭辞強化
クエリ/文章の接頭辞を追加することで類似度計算の効果を向上させることができます

Model Capabilities

文の類似度計算
テキスト特徴抽出
意味検索
テキストクラスタリング
情報検索

Use Cases

情報検索
質問応答システム
クエリと候補回答の類似度を計算することで質問応答機能を実現
JMTEB検索タスクで69.82点を獲得
テキスト分析
テキストクラスタリング
類似テキストを自動的にグループ化
JMTEBクラスタリングタスクで54.16点を獲得
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase