U

USER Bge M3

deepvkによって開発
ロシア語汎用文エンコーダー、sentence-transformersフレームワークベース、ロシア語テキストから1024次元密ベクトルを抽出するために特別設計
ダウンロード数 339.46k
リリース時間 : 7/5/2024

モデル概要

このモデルはロシア語の文や段落を1024次元密ベクトル空間にマッピングでき、クラスタリングや意味検索などのタスクに適しています。bge-m3モデルアーキテクチャを基にロシア語処理能力を最適化しました。

モデル特徴

ロシア語最適化
ロシア語テキストに特化して最適化訓練され、ロシア語意味理解タスクで優れた性能を発揮
複数データセット訓練
ru-HNP、ru-WANLIなど複数のロシア語データセットを統合して訓練
高性能ベクトルエンコーディング
1024次元密ベクトルを生成し、効率的な類似度計算とクラスタリング分析をサポート

モデル能力

ロシア語テキストベクトル化
意味的類似度計算
テキストクラスタリング分析
特徴抽出

使用事例

情報検索
ロシア語意味検索
ロシア語検索エンジンの意味マッチング機能を構築
encodechkaベンチマークテストで平均スコア0.799
テキスト分析
ロシア語テキストクラスタリング
ロシア語ニュースやソーシャルメディアコンテンツの主題クラスタリング
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase