R

Ruri V3 Pt 30m

cl-nagoyaによって開発
RuriはModernBERT-Jaを基に構築された日本語汎用テキスト埋め込みモデルで、さまざまなパラメータサイズのバージョンを提供し、多様なテキスト処理タスクに適しています。
ダウンロード数 250
リリース時間 : 3/20/2025

モデル概要

Ruriは日本語汎用テキスト埋め込みモデルで、主に文の類似性計算と特徴抽出に使用されます。ModernBERT-Jaアーキテクチャを基にしており、複数のテキストタイプのプレフィックス区別をサポートしています。

モデル特徴

マルチパラメータサイズバージョン
30Mから310Mまでの異なるパラメータサイズのモデルバージョンを提供し、さまざまな計算リソース要件に対応
1+3プレフィックス方式
テキストタイプを区別する特殊プレフィックスを使用:空文字列は意味的エンコーディング用、'トピック:'は分類/クラスタリング用、'検索クエリ:'は検索クエリ用、'検索文書:'は検索対象文書用
高性能
JMTEBベンチマークで74.51から77.24の平均スコア(異なるサイズバージョン)を達成

モデル能力

文の類似性計算
テキスト特徴抽出
意味的エンコーディング
分類/クラスタリングエンコーディング
検索クエリエンコーディング
文書検索エンコーディング

使用事例

情報検索
文書検索
'検索クエリ:'と'検索文書:'プレフィックスを使用してクエリと文書をエンコードし、効率的な検索を実現
テキスト分析
トピック分類
'トピック:'プレフィックスを使用してテキストをトピックエンコード
意味的類似性計算
異なるテキストの埋め込みベクトルを比較して意味的類似性を計算
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase