🚀 用于情感分析的瑞典语BERT模型
Recorded Future 与 AI Sweden 联合发布了两个用于瑞典语情感分析的语言模型。这两个模型基于 KB/bert-base-swedish-cased 模型,并针对多标签情感分析任务进行了微调。
这些模型针对恐惧和暴力两种情感进行了微调。模型会在相应索引处输出三个浮点数,分别对应 “负面”、“弱情感” 和 “强情感” 标签。
这些模型在以对话为重点的瑞典语数据上进行了训练,这些数据收集自各种互联网来源和论坛。
这些模型仅在瑞典语数据上进行训练,仅支持对瑞典语输入文本进行推理。对于所有非瑞典语输入,模型的推理指标未定义,这些输入被视为域外数据。
当前模型支持 Transformers 版本 >= 4.3.3 和 Torch 版本 1.8.0,与旧版本的兼容性未经验证。
✨ 主要特性
瑞典语情感 - 恐惧模型
导入模型
可以通过以下代码从 transformers 库中导入该模型:
from transformers import BertForSequenceClassification, BertTokenizerFast
tokenizer = BertTokenizerFast.from_pretrained("RecordedFuture/Swedish-Sentiment-Fear")
classifier_fear = BertForSequenceClassification.from_pretrained("RecordedFuture/Swedish-Sentiment-Fear")
当模型和分词器初始化后,即可用于推理。
情感定义
- 强情感:包括但不限于以下文本:对恐惧和/或焦虑有明显表达强调的文本。
- 弱情感:包括但不限于以下文本:以中立方式表达恐惧和/或焦虑的文本。
验证指标
在训练过程中,模型在以下分类断点处达到了最大验证指标:
分类断点 |
F值 |
精确率 |
召回率 |
0.45 |
0.8754 |
0.8618 |
0.8895 |
瑞典语情感 - 暴力模型
导入模型
可以通过以下代码从 transformers 库中导入该模型:
from transformers import BertForSequenceClassification, BertTokenizerFast
tokenizer = BertTokenizerFast.from_pretrained("RecordedFuture/Swedish-Sentiment-Violence")
classifier_violence = BertForSequenceClassification.from_pretrained("RecordedFuture/Swedish-Sentiment-Violence")
当模型和分词器初始化后,即可用于推理。
情感定义
- 强情感:包括但不限于以下文本:提及高度暴力行为、语气激进的文本。
- 弱情感:包括但不限于以下文本:包含未达到强情感标准的一般性暴力表述的文本。
验证指标
在训练过程中,模型在以下分类断点处达到了最大验证指标:
分类断点 |
F值 |
精确率 |
召回率 |
0.35 |
0.7677 |
0.7456 |
0.791 |
📄 许可证
本项目采用 MIT 许可证。