🚀 FEEL-IT:意大利语情感与情绪分类
FEEL-IT是一个用于意大利语情感与情绪分类的项目。它提供了一个新颖的基准语料库,可用于对意大利语推文进行情感和情绪分类,同时还发布了开源的Python库,方便研究人员使用。
🚀 快速开始
你可以在 此处 找到使用此模型进行情感和情绪分类的Python包。它是基于HuggingFace模型的一个非常简单的接口。
✨ 主要特性
- 多任务处理:既能进行情感分析,也能进行情绪分类。
- 新颖语料库:引入了一个新的意大利语Twitter帖子基准语料库,标注了四种基本情绪。
- 开源库:提供开源的Python库,方便研究人员使用。
📦 安装指南
文档未提及具体安装步骤,暂不提供。
💻 使用示例
基础用法
from transformers import pipeline
classifier = pipeline("text-classification",model='MilaNLProc/feel-it-italian-emotion',top_k=2)
prediction = classifier("Oggi sono proprio contento!")
print(prediction)
📚 详细文档
模型概述
属性 |
详情 |
模型类型 |
feel-it-italian-sentiment 和feel-it-italian-emotion |
训练数据 |
从广泛主题的推文中收集并标注了情感标签的2037条推文 |
模型介绍
feel-it-italian-emotion 模型可对意大利语进行 情绪分类(喜悦、恐惧、愤怒、悲伤)。我们在新数据集(即FEEL-IT)上对 UmBERTo模型 进行了微调,在不同的基准语料库上取得了最先进的性能。
数据说明
我们的数据是通过对广泛主题的推文进行标注收集而来的。总共收集了2037条标注了情绪标签的推文。更多详细信息可在我们的论文 (https://aclanthology.org/2021.wassa-1.8/) 中找到。
性能评估
我们使用 MultiEmotions-It 评估模型性能。该数据集在主题多样性和所考虑的社交媒体(即YouTube和Facebook)方面与FEEL-IT不同。我们只考虑了FEEL-IT中存在的情绪子集。为了提供参考,我们还展示了最频繁类别(MFC)基线结果。结果表明,在FEEL-IT上进行训练即使在不同上下文的数据集上也能带来稳定的性能。
训练数据集 |
宏F1值 |
准确率 |
MFC |
0.20 |
0.64 |
FEEL-IT |
0.57 |
0.73 |
📄 许可证
用户应参考 以下许可证。
🔧 技术细节
文档未提供具体技术细节,暂不提供。
📚 引用
如果您在项目中使用此模型,请使用以下BibTeX条目:
@inproceedings{bianchi2021feel,
title = {{"FEEL-IT: Emotion and Sentiment Classification for the Italian Language"}},
author = "Bianchi, Federico and Nozza, Debora and Hovy, Dirk",
booktitle = "Proceedings of the 11th Workshop on Computational Approaches to Subjectivity, Sentiment and Social Media Analysis",
year = "2021",
publisher = "Association for Computational Linguistics",
}