R

Ruri Base

cl-nagoyaによって開発
Ruriは日本語に特化した汎用テキスト埋め込みモデルで、文の類似度計算と特徴抽出タスクに焦点を当てています。
ダウンロード数 523.56k
リリース時間 : 8/28/2024

モデル概要

RuriはBERTアーキテクチャを基にした日本語テキスト埋め込みモデルで、主に文の類似度計算とテキスト特徴抽出に使用されます。クエリや段落テキストの前に特定の接頭辞を追加することで、より良い効果が得られます。

モデル特徴

日本語最適化
日本語テキストに特化して最適化されており、日本語タスクで優れた性能を発揮します
長文対応
最大512トークンのシーケンス長をサポートし、比較的長いテキストを処理できます
高性能
JMTEBベンチマークテストで他の日本語モデルよりも優れた性能を示しています
接頭辞強化
クエリ/文章の接頭辞を追加することで類似度計算の効果を向上させることができます

モデル能力

文の類似度計算
テキスト特徴抽出
意味検索
テキストクラスタリング
情報検索

使用事例

情報検索
質問応答システム
クエリと候補回答の類似度を計算することで質問応答機能を実現
JMTEB検索タスクで69.82点を獲得
テキスト分析
テキストクラスタリング
類似テキストを自動的にグループ化
JMTEBクラスタリングタスクで54.16点を獲得
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase