Ukr Roberta Base
U
Ukr Roberta Base
youscanによって開発
ウクライナ語の大規模コーパスを使って訓練されたRoBERTa基礎モデルで、ウクライナ語の自然言語処理タスクに適しています。
ダウンロード数 3,702
リリース時間 : 3/2/2022
モデル概要
これはウクライナ語のウィキペディア、OSCAR重複排除データセット、ソーシャルメディアのテキストを使って訓練されたRoBERTa基礎モデルで、roberta-base-casedと同じアーキテクチャを採用し、ウクライナ語に特化して最適化されています。
モデル特徴
大規模ウクライナ語の事前学習
33億文字以上のウクライナ語コーパスを使って事前学習を行い、ウィキペディア、OSCAR重複排除データセット、ソーシャルメディアのテキストが含まれています。
標準RoBERTaアーキテクチャ
roberta-base-casedと同じ12層のTransformerアーキテクチャを採用し、他のRoBERTaモデルとの互換性を確保します。
効率的な訓練
4枚のV100グラフィックカードを使って85時間で訓練を完了し、訓練効率が高いです。
モデル能力
テキスト理解
テキスト分類
固有表現抽出
質問応答システム
テキスト生成
使用事例
テキスト分析
ウクライナ語の感情分析
ウクライナ語のソーシャルメディアのテキストの感情傾向を分析します。
ウクライナ語のニュース分類
ウクライナ語のニュース記事を自動的に分類します。
言語理解
ウクライナ語の質問応答システム
ウクライナ語に基づく知識質問応答システムを構築します。
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98