R

Ruri Small

cl-nagoyaによって開発
Ruriは日本語テキスト埋め込みに特化したモデルで、文の類似度計算やテキスト特徴抽出を効率的に行えます。
ダウンロード数 11.75k
リリース時間 : 8/28/2024

モデル概要

このモデルは日本語汎用テキスト埋め込みモデルで、主に文の類似度計算と特徴抽出に使用されます。DistilBertアーキテクチャを基に、最大512トークンのシーケンス長をサポートし、出力次元は768です。

モデル特徴

効率的な日本語処理
日本語テキストに最適化されており、日本語の意味的特徴を正確に理解できます
高性能
JMTEB評価で優れた成績を収め、同類モデルを凌駕しています
軽量化
わずか68Mパラメータの小型モデルで、リソースが限られた環境に適しています
長文対応
最大512トークンのシーケンス長をサポートしています

モデル能力

日本語テキスト特徴抽出
文類似度計算
意味的検索
テキストクラスタリング

使用事例

情報検索
意味的検索
クエリの意味に基づいて関連文書を検索
JMTEB検索タスクで69.41点を獲得
テキスト分析
テキストクラスタリング
意味的に類似したテキストをグループ化
JMTEBクラスタリングタスクで51.19点を獲得
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase