U

Ukr Roberta Base

youscanによって開発
ウクライナ語の大規模コーパスを使って訓練されたRoBERTa基礎モデルで、ウクライナ語の自然言語処理タスクに適しています。
ダウンロード数 3,702
リリース時間 : 3/2/2022

モデル概要

これはウクライナ語のウィキペディア、OSCAR重複排除データセット、ソーシャルメディアのテキストを使って訓練されたRoBERTa基礎モデルで、roberta-base-casedと同じアーキテクチャを採用し、ウクライナ語に特化して最適化されています。

モデル特徴

大規模ウクライナ語の事前学習
33億文字以上のウクライナ語コーパスを使って事前学習を行い、ウィキペディア、OSCAR重複排除データセット、ソーシャルメディアのテキストが含まれています。
標準RoBERTaアーキテクチャ
roberta-base-casedと同じ12層のTransformerアーキテクチャを採用し、他のRoBERTaモデルとの互換性を確保します。
効率的な訓練
4枚のV100グラフィックカードを使って85時間で訓練を完了し、訓練効率が高いです。

モデル能力

テキスト理解
テキスト分類
固有表現抽出
質問応答システム
テキスト生成

使用事例

テキスト分析
ウクライナ語の感情分析
ウクライナ語のソーシャルメディアのテキストの感情傾向を分析します。
ウクライナ語のニュース分類
ウクライナ語のニュース記事を自動的に分類します。
言語理解
ウクライナ語の質問応答システム
ウクライナ語に基づく知識質問応答システムを構築します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase