🚀 モデルカード:CLF - SENTIMENTOS - CMTS ファインチューニング済み XLM - RoBERTa
このモデルは、自然言語処理(NLP)の特定のタスク、特にブラジルポルトガル語のソーシャルメディアから抽出されたテキストの感情分類(エモジの処理も含む)に機械学習技術を適用したものです。このモデルは、多言語の広範なデータで事前学習された非常に効果的で堅牢なTransformerアーキテクチャであるXLM - RoBERTaを適応させたものです。
✨ 主な機能
- ブラジルポルトガル語のソーシャルメディアテキストの感情分類を行い、エモジの解釈も含む。
- 特定のデータセットでXLM - RoBERTaのパラメータを調整し、感情分類タスクに最適化。
- 広範なデータセットを使用して学習し、様々なコンテキストと言語表現に対応。
- ソーシャルメディアのコメントの感情を正確に分類し、ポジティブ、ネガティブ、ニュートラルのラベルを付与。
📦 インストール
このモデルは、transformers
ライブラリを使用して利用できます。以下のコードでインストールできます。
pip install transformers
💻 使用例
基本的な使用法
from transformers import pipeline
analise_sentimento = pipeline("text-classification", model="tbluhm/clf-sentimentos-cmts")
texto = "Excelente notícia para todos os brasileiros!"
resultado = analise_sentimento(texto)
print(resultado)
📚 ドキュメント
モデルの起源
このモデルは、xlm - roberta - base - tweet - sentiment - pt
をファインチューニングしたバージョンです。
性能指標
このモデルは、評価セットで以下の結果を達成しています。
指標 |
値 |
Loss |
0.7189 |
Accuracy |
0.6467 |
F1 |
0.5588 |
モデルの目的
このモデルの目的は、短いテキストの感情をポジティブ、ネガティブ、ニュートラルなどのカテゴリに分類することです。ソーシャルメディアの感情分析、製品評価、顧客フィードバックなど、様々なアプリケーションで使用できます。
想定される使用方法
モデルを使用するには、短いテキストを感情分析パイプラインに入力するだけです。モデルはテキストの感情をポジティブ、ネガティブ、ニュートラルとして分類します。
学習データ
このモデルは、様々な言語の製品評価、ツイート、その他の短いテキストソースから構成されるデータセットでファインチューニングされました。学習データセットには、100万以上のラベル付きサンプルが含まれています。
制限事項と倫理的な考慮事項
モデルは人間の感情のすべての側面を捉えられない場合があり、すべての状況で完璧ではないことに注意してください。また、モデルは学習データに含まれるバイアスを反映する可能性があります。したがって、モデルを使用する際には慎重になり、その制限事項を考慮することをお勧めします。
🔧 技術詳細
学習ハイパーパラメータ
学習中に使用されたハイパーパラメータは以下の通りです。
- learning_rate: 2e - 05
- train_batch_size: 64
- eval_batch_size: 64
- seed: 42
- optimizer: Adam (betas=(0.9, 0.999), epsilon = 1e - 08)
- lr_scheduler_type: linear
- num_epochs: 2
学習結果
学習損失 |
エポック |
ステップ |
検証損失 |
正解率 |
F1 |
0.7039 |
1.0 |
9 |
0.7650 |
0.6413 |
0.5526 |
0.6487 |
2.0 |
18 |
0.7189 |
0.6467 |
0.5588 |
フレームワークバージョン
- Transformers 4.38.2
- Pytorch 2.2.1+cpu
- Datasets 2.18.0
- Tokenizers 0.15.2
📄 ライセンス
このモデルはMITライセンスの下で提供されています。
引用
Author: Thiago D. Faria Bluhm. (2024).
Adaptado de: [XLM - ROBERTA](https://huggingface.co/FacebookAI/xlm - roberta - base).
貢献に感謝
コラボレーター: Wesley Dos Anjos, Pedro Lustosa, Amanda Rangel, Audrey Marx, Gabriel Leal e Tiago Vettorazi.