🚀 印尼语RoBERTa情感分类器
印尼语RoBERTa情感分类器是一个基于Indo - roberta模型的情感分类器。它在IndoNLU EmoT数据集上进行训练。所使用的模型为Indo - roberta,并通过迁移学习转换为情感分类器模型。根据IndoNLU基准测试,该模型的F1 - 宏平均得分为72.05%,准确率为71.81%,精确率为72.47%,召回率为71.94%。
✨ 主要特性
- 基于Indo - roberta模型,在IndoNLU EmoT数据集上训练。
- 经过迁移学习,从预训练模型转换为情感分类器。
- 在IndoNLU基准测试中取得了较好的评估指标。
📦 安装指南
文档未提及安装步骤,暂不展示。
💻 使用示例
基础用法
from transformers import pipeline
pretrained_name = "StevenLimcorn/indonesian-roberta-base-emotion-classifier"
nlp = pipeline(
"sentiment-analysis",
model=pretrained_name,
tokenizer=pretrained_name
)
nlp("Hal-hal baik akan datang.")
📚 详细文档
模型
该模型在7个训练周期中进行训练,学习率为2e - 5。取得的各项指标如下所示:
训练周期 |
训练损失 |
验证损失 |
准确率 |
F1值 |
精确率 |
召回率 |
1 |
1.300700 |
1.005149 |
0.622727 |
0.601846 |
0.640845 |
0.611144 |
2 |
0.806300 |
0.841953 |
0.686364 |
0.694096 |
0.701984 |
0.696657 |
3 |
0.591900 |
0.796794 |
0.686364 |
0.696573 |
0.707520 |
0.691671 |
4 |
0.441200 |
0.782094 |
0.722727 |
0.724359 |
0.725985 |
0.730229 |
5 |
0.334700 |
0.809931 |
0.711364 |
0.720550 |
0.718318 |
0.724608 |
6 |
0.268400 |
0.812771 |
0.718182 |
0.724192 |
0.721222 |
0.729195 |
7 |
0.226000 |
0.828461 |
0.725000 |
0.733625 |
0.731709 |
0.735800 |
注意事项
请考虑预训练的RoBERTa模型和EmoT
数据集可能存在的偏差,这些偏差可能会影响该模型的预测结果。
作者信息
印尼语RoBERTa基础情感分类器由Steven Limcorn进行训练和评估。所有的计算和开发工作均在Google Colaboratory上使用其免费GPU完成。
如果使用该模型,请引用以下文献:
@misc {steven_limcorn_2023,
author = { {Steven Limcorn} },
title = { indonesian-roberta-base-emotion-classifier (Revision e8a9cb9) },
year = 2023,
url = { https://huggingface.co/StevenLimcorn/indonesian-roberta-base-emotion-classifier },
doi = { 10.57967/hf/0681 },
publisher = { Hugging Face }
}
📄 许可证
本项目采用MIT许可证。
属性 |
详情 |
模型类型 |
基于Indo - roberta的情感分类器 |
训练数据 |
IndoNLU EmoT数据集 |