R

Ruropebert E5 Base 2k

Tochka-AIによって開発
RoPEBertアーキテクチャに基づいて開発されたロシア語の文エンコーダーモ型で、2048トークンのコンテキスト長をサポートし、encodechkaベンチマークテストで優れた性能を発揮します。
ダウンロード数 2,422
リリース時間 : 2/22/2024

モデル概要

Tochka AIによって開発されたロシア語の文埋め込みモデルで、RoPEBertアーキテクチャを採用し、主にロシア語テキストの特徴抽出と文類似度計算に使用されます。

モデル特徴

長文コンテキスト対応
最大2048トークンのコンテキスト処理をサポートし、さらに長いコンテキストに拡張可能
効率的なアテンションメカニズム
SDPA効率的アテンション実装をサポートし、処理速度を向上
RoPEスケーリング
linearとdynamicの2種類のRoPEスケーリングタイプをサポートし、モデルのコンテキストウィンドウを拡張可能
内蔵プーラー
meanとfirst_token_transformの2種類のプーラー実装を内蔵し、直接文埋め込みを取得可能

モデル能力

ロシア語テキスト特徴抽出
文類似度計算
テキスト分類
長文処理

使用事例

テキスト類似度
文類似度計算
ロシア語の文間の意味的類似度を計算
コサイン類似度スコアで文の類似度を測定
テキスト分類
ロシア語テキスト分類
分類ヘッドを追加することでテキスト分類タスクを実行可能
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase