R

Roberta Base

deepvkによって開発
ロシア語の事前学習用の双方向エンコーダモデルで、大規模なテキストコーパスを基に訓練され、特徴抽出タスクをサポートします。
ダウンロード数 44
リリース時間 : 2/7/2023

モデル概要

これはRoBERTaアーキテクチャに基づくロシア語の事前学習モデルで、主にテキストの特徴抽出に使用されます。モデルは大規模なロシア語コーパス(ソーシャルデータ、ウィキペディア、ニュースなどの様々なテキストタイプを含む)で訓練されています。

モデル特徴

ロシア語最適化
ロシア語のテキストに特化して事前学習され、豊富なロシア語の言語特徴を含んでいます。
大規模な訓練データ
500GBのロシア語テキストデータを使用して訓練され、様々なテキストタイプと分野を網羅しています。
高性能アーキテクチャ
RoBERTaアーキテクチャに基づき、12層のエンコーダと768次元の埋め込み空間を持っています。

モデル能力

ロシア語テキストの特徴抽出
文脈の意味理解
多分野のテキスト処理

使用事例

自然言語処理
テキスト分類
ロシア語のテキスト分類タスクに使用できます。
Russian Super Glueベンチマークテストで良好な結果を示しました。
意味解析
ロシア語のテキストの意味理解と分析に適しています。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase