🚀 英语情感分析DistilRoBERTa-base模型
本模型可用于对英文文本数据进行情感分类。它在6个不同的数据集上进行训练(详见下方附录),能够预测Ekman提出的6种基本情感,外加一个中性类别:
- 愤怒 🤬
- 厌恶 🤢
- 恐惧 😨
- 喜悦 😀
- 中性 😐
- 悲伤 😭
- 惊讶 😲
该模型是DistilRoBERTa-base的微调版本。若需要“非蒸馏”的情感模型,请参考RoBERTa-large版本的模型卡片。
🚀 快速开始
单文本示例
在Google Colab上使用Hugging Face的pipeline命令,只需3行代码即可运行情感模型:

from transformers import pipeline
classifier = pipeline("text-classification", model="j-hartmann/emotion-english-distilroberta-base", return_all_scores=True)
classifier("I love this!")
输出:
[[{'label': 'anger', 'score': 0.004419783595949411},
{'label': 'disgust', 'score': 0.0016119900392368436},
{'label': 'fear', 'score': 0.0004138521908316761},
{'label': 'joy', 'score': 0.9771687984466553},
{'label': 'neutral', 'score': 0.005764586851000786},
{'label': 'sadness', 'score': 0.002092392183840275},
{'label': 'surprise', 'score': 0.008528684265911579}]]
多示例和完整数据集
在Google Colab上对多个示例和完整数据集(如.csv文件)运行情感模型:

💻 联系我们
如果您有任何问题或反馈,请联系 jochen.hartmann@tum.de。
感谢Samuel Domdey和 chrsiebert 对本模型发布的支持。
✅ 引用信息
如果您使用此模型,请引用以下内容。相关工作论文即将发布。
Jochen Hartmann, "Emotion English DistilRoBERTa-base". https://huggingface.co/j-hartmann/emotion-english-distilroberta-base/, 2022.
BibTex引用格式:
@misc{hartmann2022emotionenglish,
author={Hartmann, Jochen},
title={Emotion English DistilRoBERTa-base},
year={2022},
howpublished = {\url{https://huggingface.co/j-hartmann/emotion-english-distilroberta-base/}},
}
📚 附录
以下是用于训练的数据集概述。所有数据集均包含英文文本。该表格总结了每个数据集中包含哪些情感标签。这些数据集涵盖了多种文本类型,具体包括来自Twitter、Reddit、学生自我报告以及电视对话的文本情感标签。由于MELD(多模态情感线数据集)是对流行的情感线数据集的扩展,因此这里不包含情感线数据集本身。
名称 |
愤怒 |
厌恶 |
恐惧 |
喜悦 |
中性 |
悲伤 |
惊讶 |
Crowdflower (2016) |
是 |
- |
- |
是 |
是 |
是 |
是 |
Emotion Dataset, Elvis et al. (2018) |
是 |
- |
是 |
是 |
- |
是 |
是 |
GoEmotions, Demszky et al. (2020) |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
ISEAR, Vikash (2018) |
是 |
是 |
是 |
是 |
- |
是 |
- |
MELD, Poria et al. (2019) |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
SemEval-2018, EI-reg, Mohammad et al. (2018) |
是 |
- |
是 |
是 |
- |
是 |
- |
该模型在上述数据集的一个平衡子集上进行训练(每种情感2811个观测值,即总共近20000个观测值)。这个平衡子集的80%用于训练,20%用于评估。评估准确率为66%(随机猜测的基线准确率为1/7 = 14%)。
📖 科学应用
以下是使用“英语情感分析DistilRoBERTa-base模型”的论文列表。如果您希望您的论文被添加到列表中,请给我发送电子邮件。
- Butt, S., Sharma, S., Sharma, R., Sidorov, G., & Gelbukh, A. (2022). What goes on inside rumour and non-rumour tweets and their reactions: A Psycholinguistic Analyses. Computers in Human Behavior, 107345.
- Kuang, Z., Zong, S., Zhang, J., Chen, J., & Liu, H. (2022). Music-to-Text Synaesthesia: Generating Descriptive Text from Music Recordings. arXiv preprint arXiv:2210.00434.
- Rozado, D., Hughes, R., & Halberstadt, J. (2022). Longitudinal analysis of sentiment and emotion in news media headlines using automated labelling with Transformer language models. Plos one, 17(10), e0276367.