🚀 FEEL-IT:意大利语情感与情绪分类
FEEL-IT是一个用于意大利语情感与情绪分类的项目。它提供了一个标注有四种基本情绪(愤怒、恐惧、喜悦、悲伤)的意大利语推特帖子基准语料库,通过该语料库训练的模型可用于对意大利语文本进行情感和情绪分析。
🚀 快速开始
你可以在 此处 找到使用此模型进行情感和情绪分类的Python包,它是基于HuggingFace模型的一个非常简单的接口。
✨ 主要特性
- 提供了一个新颖的意大利语推特帖子基准语料库FEEL-IT,标注有四种基本情绪:愤怒、恐惧、喜悦、悲伤。
- 可通过合并情绪标签进行情感分析。
- 发布了一个开源Python库,方便研究人员使用基于FEEL-IT训练的模型对意大利语文本进行情感和情绪推理。
📦 安装指南
文档未提及安装步骤,暂不提供。
💻 使用示例
基础用法
from transformers import pipeline
classifier = pipeline("text-classification",model='MilaNLProc/feel-it-italian-sentiment',top_k=2)
prediction = classifier("Oggi sono proprio contento!")
print(prediction)
📚 详细文档
模型
feel-it-italian-sentiment 模型用于对意大利语进行情感分析。我们在新的数据集(即FEEL-IT)上对 UmBERTo模型 进行了微调,在不同的基准语料库上取得了最先进的性能。
数据
我们的数据是通过对广泛主题的推文进行标注收集而来的。总共标注了2037条带有情绪标签的推文。更多详细信息可在我们的论文 (https://aclanthology.org/2021.wassa-1.8/) 中找到。
性能
我们使用 SENTIPOLC16 Evalita 评估模型性能。我们将FEEL-IT的类别合并为2类,将喜悦映射到积极类别,将愤怒、恐惧和悲伤映射到消极类别。我们比较了三种不同的实验配置:在FEEL-IT、SENTIPOLC16或两者上进行训练,并在SENTIPOLC16测试集上进行测试。
结果表明,在FEEL-IT上进行训练在SENTIPOLC16测试集上的表现优于在SENTIPOLC16训练集上的表现。
训练数据集 |
宏F1值 |
准确率 |
SENTIPOLC16 |
0.80 |
0.81 |
FEEL-IT |
0.81 |
0.84 |
FEEL-IT+SentiPolc |
0.81 |
0.82 |
模型下载
模型 |
下载链接 |
feel-it-italian-sentiment |
链接 |
feel-it-italian-emotion |
链接 |
🔧 技术细节
情感分析是理解人们在线反应的常见任务,但我们通常需要更细致的信息,例如一条负面帖子是因为用户愤怒还是悲伤。目前有很多方法可以处理情感和情绪分类任务,但至少对于意大利语来说,这些方法通常一次只处理其中一个任务。我们引入了FEEL-IT,一个标注有四种基本情绪(愤怒、恐惧、喜悦、悲伤)的意大利语推特帖子基准语料库,通过合并这些情绪标签,我们也可以进行情感分析。我们在不同的基准语料库上评估了该语料库,取得了有竞争力的结果。
📄 许可证
用户应参考 以下许可证。
📚 引用
如果您在项目中使用了此模型,请使用以下BibTeX引用:
@inproceedings{bianchi2021feel,
title = {{"FEEL-IT: Emotion and Sentiment Classification for the Italian Language"}},
author = "Bianchi, Federico and Nozza, Debora and Hovy, Dirk",
booktitle = "Proceedings of the 11th Workshop on Computational Approaches to Subjectivity, Sentiment and Social Media Analysis",
year = "2021",
publisher = "Association for Computational Linguistics",
}