🚀 FEEL-IT: イタリア語の感情とセンチメント分類
FEEL-ITは、イタリア語のツイートに対する感情とセンチメント分類を行うためのモデルです。新しいベンチマークコーパスを用いて、4つの基本的な感情(怒り、恐怖、喜び、悲しみ)の分類と、それらをまとめたセンチメント分析を行うことができます。
🚀 クイックスタート
このモデルを使用した感情とセンチメント分類のPythonパッケージは、こちら で見つけることができます。これは、HuggingFaceモデル上の非常にシンプルなインターフェースです。
✨ 主な機能
- イタリア語のツイートに対する感情分類(怒り、恐怖、喜び、悲しみ)
- 感情分類をまとめたセンチメント分析
- 最新のパフォーマンスを達成するためのモデル
📦 インストール
Pythonパッケージは こちら から入手できます。
💻 使用例
基本的な使用法
from transformers import pipeline
classifier = pipeline("text-classification",model='MilaNLProc/feel-it-italian-sentiment',top_k=2)
prediction = classifier("Oggi sono proprio contento!")
print(prediction)
📚 ドキュメント
概要
センチメント分析は、オンライン上の人々の反応を理解するための一般的なタスクです。しかし、私たちはしばしばよりニュアンスのある情報が必要です。投稿が否定的なのは、ユーザーが怒っているからなのか、悲しんでいるからなのか?
多くのアプローチがこれらのタスクを解決するために導入されています。しかし、少なくともイタリア語の場合、それらはすべて一度に1つのタスクのみを扱っています。私たちは FEEL-IT を導入します。これは、4つの基本的な感情(怒り、恐怖、喜び、悲しみ)で注釈付けされたイタリア語のTwitter投稿の新しいベンチマークコーパスです。これらをまとめることで、センチメント分析 も行うことができます。私たちは、感情分類とセンチメント分類のベンチマークデータセットでコーパスを評価し、競争力のある結果を得ています。
私たちは、オープンソースのPythonライブラリ をリリースしているので、研究者はFEEL-ITで学習されたモデルを使用して、イタリア語のテキストからセンチメントと感情を推論することができます。
モデル |
ダウンロード |
feel-it-italian-sentiment |
リンク |
feel-it-italian-emotion |
リンク |
モデル
feel-it-italian-sentiment モデルは、イタリア語の センチメント分析 を行います。私たちは、新しいデータセット(FEEL-IT)で UmBERToモデル をファインチューニングし、さまざまなベンチマークコーパスで最先端のパフォーマンスを達成しました。
データ
私たちのデータは、幅広いトピックのツイートを注釈付けすることで収集されました。合計で、感情ラベルが付けられた2037件のツイートがあります。詳細は、私たちの論文 (https://aclanthology.org/2021.wassa-1.8/) で確認できます。
パフォーマンス
私たちは、SENTIPOLC16 Evalita を使用してパフォーマンスを評価しています。FEEL-ITのクラスを2つにまとめ、喜びを ポジティブ クラスに、怒り、恐怖、悲しみを ネガティブ クラスにマッピングしました。FEEL-IT、SENTIPOLC16、またはその両方で学習させた3つの異なる実験設定を、SENTIPOLC16のテストセットでテストして比較しました。
結果は、FEEL-ITで学習させたモデルが、SENTIPOLC16の学習セットで学習させたモデルよりも、SENTIPOLC16のテストセットで良い結果を得ることを示しています。
学習データセット |
マクロF1 |
正解率 |
SENTIPOLC16 |
0.80 |
0.81 |
FEEL-IT |
0.81 |
0.84 |
FEEL-IT+SentiPolc |
0.81 |
0.82 |
🔧 技術詳細
📄 ライセンス
ユーザーは 次のライセンス を参照する必要があります。
引用
このモデルをあなたのプロジェクトで使用する場合は、次のBibTeXエントリを使用してください。
@inproceedings{bianchi2021feel,
title = {{"FEEL-IT: Emotion and Sentiment Classification for the Italian Language"}},
author = "Bianchi, Federico and Nozza, Debora and Hovy, Dirk",
booktitle = "Proceedings of the 11th Workshop on Computational Approaches to Subjectivity, Sentiment and Social Media Analysis",
year = "2021",
publisher = "Association for Computational Linguistics",
}