R

Ruropebert Classic Base 512

Tochka-AIによって開発
RoPEBertアーキテクチャに基づいて開発されたロシア語エンコーダーモデルで、クローン手法でトレーニングされ、512トークンのコンテキストをサポートし、品質面で元のruBert-baseモデルを上回っています
ダウンロード数 103
リリース時間 : 2/22/2024

モデル概要

これはロシア語に最適化されたテキストエンコーダーモデルで、主にテキスト特徴抽出と分類タスクに使用され、改良されたRoPEBertアーキテクチャに基づいて開発されています

モデル特徴

RoPEアーキテクチャ改良
Rotary Position Embedding(RoPE)技術を採用した改良Bertアーキテクチャで、より優れた位置エンコーディング効果を提供します
長文コンテキストサポート
512トークンのコンテキストをネイティブサポートし、RoPEスケーリングにより更に長いテキスト処理が可能です
効率的なアテンションメカニズム
SDPA効率的アテンション実装をサポートし、計算効率を向上させます
内蔵プーラー
meanとfirst_token_transformの2種類のプーリング方式を提供し、テキスト埋め込みベクトルの取得を容易にします

モデル能力

テキスト特徴抽出
テキスト類似度計算
テキスト分類
長文処理

使用事例

意味理解
テキスト類似度計算
2つのロシア語テキストの意味的類似度を計算します
正規化された埋め込みベクトルと行列乗算によって実現されます
テキスト分類
感情分析
ロシア語テキストの感情傾向を分類します
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase