R

Ruropebert E5 Base 2k

Developed by Tochka-AI
RoPEBertアーキテクチャに基づいて開発されたロシア語の文エンコーダーモ型で、2048トークンのコンテキスト長をサポートし、encodechkaベンチマークテストで優れた性能を発揮します。
Downloads 2,422
Release Time : 2/22/2024

Model Overview

Tochka AIによって開発されたロシア語の文埋め込みモデルで、RoPEBertアーキテクチャを採用し、主にロシア語テキストの特徴抽出と文類似度計算に使用されます。

Model Features

長文コンテキスト対応
最大2048トークンのコンテキスト処理をサポートし、さらに長いコンテキストに拡張可能
効率的なアテンションメカニズム
SDPA効率的アテンション実装をサポートし、処理速度を向上
RoPEスケーリング
linearとdynamicの2種類のRoPEスケーリングタイプをサポートし、モデルのコンテキストウィンドウを拡張可能
内蔵プーラー
meanとfirst_token_transformの2種類のプーラー実装を内蔵し、直接文埋め込みを取得可能

Model Capabilities

ロシア語テキスト特徴抽出
文類似度計算
テキスト分類
長文処理

Use Cases

テキスト類似度
文類似度計算
ロシア語の文間の意味的類似度を計算
コサイン類似度スコアで文の類似度を測定
テキスト分類
ロシア語テキスト分類
分類ヘッドを追加することでテキスト分類タスクを実行可能
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase