🚀 FEEL-IT: イタリア語の感情とセンチメント分類
FEEL-ITは、イタリア語のツイート投稿に対する感情とセンチメント分類を行うためのモデルです。このモデルを用いることで、イタリア語のテキストから怒り、恐怖、喜び、悲しみなどの感情や、ポジティブ/ネガティブなセンチメントを推測することができます。
🚀 クイックスタート
このモデルを使用した感情とセンチメント分類のPythonパッケージは、こちら で見つけることができます。これは、HuggingFaceのモデルを使った非常にシンプルなインターフェースです。
✨ 主な機能
- イタリア語のテキストに対する感情分類(喜び、恐怖、怒り、悲しみ)
- イタリア語のテキストに対するセンチメント分析
- ベンチマークデータセットでの競争力のある性能
📦 インストール
インストールに関する具体的な手順は提供されていません。
💻 使用例
基本的な使用法
from transformers import pipeline
classifier = pipeline("text-classification",model='MilaNLProc/feel-it-italian-emotion',top_k=2)
prediction = classifier("Oggi sono proprio contento!")
print(prediction)
📚 ドキュメント
概要
センチメント分析は、オンライン上での人々の反応を理解するための一般的なタスクです。しかし、私たちはしばしば、よりニュアンスのある情報が必要です。例えば、投稿がネガティブであるのは、ユーザーが怒っているからなのか、悲しんでいるからなのか。
多くのアプローチがこれらのタスクを解決するために導入されています。しかし、少なくともイタリア語の場合、これらのアプローチは一度に一方のタスクしか扱っていません。私たちは FEEL-IT を導入します。これは、怒り、恐怖、喜び、悲しみの4つの基本的な感情でアノテーションされたイタリア語のTwitter投稿の新しいベンチマークコーパスです。これらをまとめることで、センチメント分析 も行うことができます。私たちは、感情分類とセンチメント分類の両方のベンチマークデータセットでコーパスを評価し、競争力のある結果を得ました。
私たちは、オープンソースのPythonライブラリ をリリースしています。これにより、研究者はFEEL-ITで訓練されたモデルを使用して、イタリア語のテキストからセンチメントと感情の両方を推測することができます。
モデル
feel-it-italian-emotion モデルは、イタリア語に対する 感情分類(喜び、恐怖、怒り、悲しみ) を行います。私たちは、新しいデータセット(FEEL-IT)で UmBERToモデル をファインチューニングし、さまざまなベンチマークコーパスで最先端の性能を達成しました。
データ
私たちのデータは、幅広いトピックのツイートをアノテーションすることで収集されました。合計で、感情ラベルが付けられた2037件のツイートがあります。詳細は、私たちの論文 (https://aclanthology.org/2021.wassa-1.8/) を参照してください。
性能
私たちは、MultiEmotions-It を使用して性能を評価しました。このデータセットは、トピックの多様性と考慮されるソーシャルメディア(YouTubeとFacebook)の点でFEEL-ITと異なります。私たちは、FEEL-ITに含まれる感情のサブセットのみを考慮しました。参考のために、最頻クラス(MFC)のベースライン結果も示しています。結果は、FEEL-ITで訓練することで、異なるコンテキストのデータセットでも安定した性能が得られることを示しています。
訓練データセット |
マクロF1 |
正解率 |
MFC |
0.20 |
0.64 |
FEEL-IT |
0.57 |
0.73 |
モデルのダウンロード
モデル |
ダウンロード |
feel-it-italian-sentiment |
リンク |
feel-it-italian-emotion |
リンク |
🔧 技術詳細
技術的な詳細に関する具体的な説明は提供されていません。
📄 ライセンス
ユーザーは 以下のライセンス を参照する必要があります。
引用
このモデルをあなたのプロジェクトで使用する場合は、以下のBibTeXエントリを使用してください。
@inproceedings{bianchi2021feel,
title = {{"FEEL-IT: Emotion and Sentiment Classification for the Italian Language"}},
author = "Bianchi, Federico and Nozza, Debora and Hovy, Dirk",
booktitle = "Proceedings of the 11th Workshop on Computational Approaches to Subjectivity, Sentiment and Social Media Analysis",
year = "2021",
publisher = "Association for Computational Linguistics",
}