ukr - roberta - baseオープンソースモデル - 無料デプロイでウクライナ語の自然言語処理タスクをサポート

Ukr Roberta Base

youscanによって開発

ウクライナ語の大規模コーパスを使って訓練されたRoBERTa基礎モデルで、ウクライナ語の自然言語処理タスクに適しています。

ダウンロード数 3,702

リリース時間 : 3/2/2022

モデル概要

これはウクライナ語のウィキペディア、OSCAR重複排除データセット、ソーシャルメディアのテキストを使って訓練されたRoBERTa基礎モデルで、roberta-base-casedと同じアーキテクチャを採用し、ウクライナ語に特化して最適化されています。

大規模ウクライナ語の事前学習

33億文字以上のウクライナ語コーパスを使って事前学習を行い、ウィキペディア、OSCAR重複排除データセット、ソーシャルメディアのテキストが含まれています。

標準RoBERTaアーキテクチャ

roberta-base-casedと同じ12層のTransformerアーキテクチャを採用し、他のRoBERTaモデルとの互換性を確保します。

効率的な訓練

4枚のV100グラフィックカードを使って85時間で訓練を完了し、訓練効率が高いです。

テキスト理解

テキスト分類

固有表現抽出

質問応答システム

テキスト生成

テキスト分析

ウクライナ語の感情分析

ウクライナ語のソーシャルメディアのテキストの感情傾向を分析します。

ウクライナ語のニュース分類

ウクライナ語のニュース記事を自動的に分類します。

言語理解

ウクライナ語の質問応答システム

ウクライナ語に基づく知識質問応答システムを構築します。