U

USER2 Base

deepvkによって開発
USER2は次世代ロシア語汎用文エンコーダーで、最大8,192トークンのコンテキスト文表現をサポート。RuModernBERT-baseを基盤とし、検索と意味タスク向けに最適化
ダウンロード数 1,101
リリース時間 : 2/25/2025

モデル概要

ロシア語向けに設計された汎用文エンコーダーで、長文コンテキスト表現とマトリョーシュカ表現学習(MRL)技術をサポート。検索や様々な意味タスクに適応

モデル特徴

長文コンテキスト対応
最大8,192トークンのテキスト処理をサポート。長文書検索や分析に適している
マトリョーシュカ表現学習(MRL)
次元削減技術をサポート。品質劣化を最小限に抑えつつ埋め込み次元を縮小可能
マルチタスクプレフィックス最適化
タスク固有プレフィックス設計を採用。様々なシナリオ(分類/クラスタリング/検索)向けに表現を最適化
効率的なパラメータ設計
1.49億パラメータのベーシック版で性能と効率性の良好なバランスを実現

モデル能力

テキスト埋め込み生成
意味的類似度計算
文書検索
テキストクラスタリング
マルチラベル分類
リランキングタスク

使用事例

情報検索
長文書検索
長文書コレクションから関連情報を検索
MLDR-rusテストでnDCG@10が54.17を達成
質問応答システム
質問と候補回答をマッチング
テキスト分析
テキストクラスタリング
類似文書をグループ化
MTEB-rusクラスタリングタスクで59.22点
意味的類似度計算
テキスト間の意味的関係を測定
MTEB-rus類似度タスクで74.28点
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase