U

USER Base

deepvkによって開発
ロシア語専用に設計された文埋め込み抽出モデルで、文や段落を768次元の稠密ベクトル空間にマッピングでき、クラスタリングや意味検索などのタスクに適しています。
ダウンロード数 2,337
リリース時間 : 6/10/2024

モデル概要

USERはsentence - transformersに基づくロシア語汎用文エンコーダで、ロシア語に特化して訓練され、様々な自然言語処理タスクに適用できます。

モデル特徴

ロシア語最適化
ロシア語に特化して訓練され、ロシア語タスクで優れた性能を発揮します。
多段階訓練
二段階の訓練プロセスを採用し、対比事前訓練とモデル融合技術を組み合わせています。
プロンプト最適化
queryとpassageのプロンプトで異なるタスクタイプを区別します。
軽量で効率的
たった85Mのパラメータで、同規模のモデルの中で最良の性能を発揮します。

モデル能力

文埋め込み抽出
意味類似度計算
テキストクラスタリング
情報検索
特徴抽出

使用事例

情報検索
質問応答システム
ユーザーのクエリと関連する文書段落をマッチングするために使用します。
MIRACLデータセットで0.763の@100リコール率を達成しました。
テキスト分析
意味類似度計算
2つの文や段落間の意味類似度を計算します。
Encodechkaベンチマークで平均スコア0.772を獲得しました。
テキストクラスタリング
類似した内容のテキストを自動的にグループ化します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase