🚀 北欧Robertaウィキモデル
このプロジェクトの北欧Robertaモデルは、スウェーデン語、デンマーク語、ノルウェー語のウィキペディアデータで訓練されており、様々な自然言語処理タスクに使用でき、北欧言語の関連研究やアプリケーションに強力なサポートを提供します。
🚀 クイックスタート
このモデルは、Hugging Faceの関連インターフェースを通じて直接呼び出すことができます。特定のタスクに合わせて、自身のニーズに応じて微調整することもできます。
✨ 主な機能
- 多言語対応:スウェーデン語、デンマーク語、ノルウェー語のウィキペディアデータで訓練されており、複数の北欧言語を処理できます。
- 幅広い応用:固有表現抽出、感情分析などの自然言語処理タスクに使用できます。
📚 ドキュメント
モデルの説明
北欧Robertaモデルは、スウェーデン語、デンマーク語、ノルウェー語のウィキペディアデータで訓練されており、複数の北欧言語を処理する能力を備えています。
評価結果
デンマーク語の固有表現抽出評価
デンマーク語の固有表現抽出タスクでは、各モデルをDaNEデータセットで3エポック微調整し、各モデルを5回繰り返し、平均値の95%信頼区間を計算しました。結果は以下の通りです:
- xlm - roberta - base : 88.01 ± 0.43
- flax - community/nordic - roberta - wiki: 85.75 ± 0.69(このモデル)
- Maltehb/danish - bert - botxo: 85.38 ± 0.55
- flax - community/roberta - base - danish: 80.14 ± 1.47
- flax - community/roberta - base - scandinavian : 78.03 ± 3.02
- Maltehb/-l - ctra - danish - electra - small - cased: 57.87 ± 3.19
- NbAiLab/nb - bert - base : 30.24 ± 1.21
- ランダムに初期化されたRoBERTaモデル: 19.79 ± 2.00
デンマーク語の感情分析評価
テストセットでの結果では、各モデルを5回訓練し、「±」は平均スコアの95%信頼区間を表します:
- Maltehb/danish - bert - botxo: 65.19 ± 0.53
- NbAiLab/nb - bert - base : 63.80 ± 0.77
- xlm - roberta - base : 63.55 ± 1.59
- flax - community/nordic - roberta - wiki : 56.46 ± 1.77
- flax - community/roberta - base - danish : 54.73 ± 8.96
- flax - community/roberta - base - scandinavian : 44.28 ± 9.21
- Maltehb/-l - ctra - danish - electra - small - cased : 47.78 ± 12.65
- ランダムに初期化されたRoBERTaモデル: 36.96 ± 1.02
- Maltehb/roberta - base - scandinavian : 33.65 ± 8.32
モデルシリーズ
このモデルは、Huggingface Flax/Jaxチャレンジ期間中に、TPU上でFlax Jaxを使用して訓練された一連のモデルの一部です。
関連モデルのリンク
GPTモデル
- スウェーデン語GPT:https://huggingface.co/birgermoell/swedish - gpt/
- スウェーデン語GPTウィキ:https://huggingface.co/flax - community/swe - gpt - wiki
- 北欧GPTウィキ:https://huggingface.co/flax - community/nordic - gpt - wiki
- デンマーク語GPTウィキ:https://huggingface.co/flax - community/dansk - gpt - wiki
- ノルウェー語GPTウィキ:https://huggingface.co/flax - community/norsk - gpt - wiki
Robertaモデル
- 北欧Robertaウィキ:https://huggingface.co/flax - community/nordic - roberta - wiki
- スウェーデン語RobertaウィキOscar:https://huggingface.co/flax - community/swe - roberta - wiki - oscar
- スウェーデン語Scandi Roberta:https://huggingface.co/birgermoell/roberta - swedish - scandi
- スウェーデン語Roberta:https://huggingface.co/birgermoell/roberta - swedish
スウェーデン語T5モデル
- スウェーデン語T5ベースモデル:https://huggingface.co/birgermoell/t5 - base - swedish
📄 ライセンス
このプロジェクトはCC - BY - 4.0ライセンスを採用しています。