🚀 FEEL-IT:意大利語情感與情緒分類
FEEL-IT是一個用於意大利語情感與情緒分類的項目。它提供了一個標註有四種基本情緒(憤怒、恐懼、喜悅、悲傷)的意大利語推特帖子基準語料庫,通過該語料庫訓練的模型可用於對意大利語文本進行情感和情緒分析。
🚀 快速開始
你可以在 此處 找到使用此模型進行情感和情緒分類的Python包,它是基於HuggingFace模型的一個非常簡單的接口。
✨ 主要特性
- 提供了一個新穎的意大利語推特帖子基準語料庫FEEL-IT,標註有四種基本情緒:憤怒、恐懼、喜悅、悲傷。
- 可通過合併情緒標籤進行情感分析。
- 發佈了一個開源Python庫,方便研究人員使用基於FEEL-IT訓練的模型對意大利語文本進行情感和情緒推理。
📦 安裝指南
文檔未提及安裝步驟,暫不提供。
💻 使用示例
基礎用法
from transformers import pipeline
classifier = pipeline("text-classification",model='MilaNLProc/feel-it-italian-sentiment',top_k=2)
prediction = classifier("Oggi sono proprio contento!")
print(prediction)
📚 詳細文檔
模型
feel-it-italian-sentiment 模型用於對意大利語進行情感分析。我們在新的數據集(即FEEL-IT)上對 UmBERTo模型 進行了微調,在不同的基準語料庫上取得了最先進的性能。
數據
我們的數據是通過對廣泛主題的推文進行標註收集而來的。總共標註了2037條帶有情緒標籤的推文。更多詳細信息可在我們的論文 (https://aclanthology.org/2021.wassa-1.8/) 中找到。
性能
我們使用 SENTIPOLC16 Evalita 評估模型性能。我們將FEEL-IT的類別合併為2類,將喜悅映射到積極類別,將憤怒、恐懼和悲傷映射到消極類別。我們比較了三種不同的實驗配置:在FEEL-IT、SENTIPOLC16或兩者上進行訓練,並在SENTIPOLC16測試集上進行測試。
結果表明,在FEEL-IT上進行訓練在SENTIPOLC16測試集上的表現優於在SENTIPOLC16訓練集上的表現。
訓練數據集 |
宏F1值 |
準確率 |
SENTIPOLC16 |
0.80 |
0.81 |
FEEL-IT |
0.81 |
0.84 |
FEEL-IT+SentiPolc |
0.81 |
0.82 |
模型下載
模型 |
下載鏈接 |
feel-it-italian-sentiment |
鏈接 |
feel-it-italian-emotion |
鏈接 |
🔧 技術細節
情感分析是理解人們在線反應的常見任務,但我們通常需要更細緻的信息,例如一條負面帖子是因為用戶憤怒還是悲傷。目前有很多方法可以處理情感和情緒分類任務,但至少對於意大利語來說,這些方法通常一次只處理其中一個任務。我們引入了FEEL-IT,一個標註有四種基本情緒(憤怒、恐懼、喜悅、悲傷)的意大利語推特帖子基準語料庫,通過合併這些情緒標籤,我們也可以進行情感分析。我們在不同的基準語料庫上評估了該語料庫,取得了有競爭力的結果。
📄 許可證
用戶應參考 以下許可證。
📚 引用
如果您在項目中使用了此模型,請使用以下BibTeX引用:
@inproceedings{bianchi2021feel,
title = {{"FEEL-IT: Emotion and Sentiment Classification for the Italian Language"}},
author = "Bianchi, Federico and Nozza, Debora and Hovy, Dirk",
booktitle = "Proceedings of the 11th Workshop on Computational Approaches to Subjectivity, Sentiment and Social Media Analysis",
year = "2021",
publisher = "Association for Computational Linguistics",
}