🚀 用于情感分析的瑞典语BERT模型
Recorded Future 与 AI Sweden 联合发布了两个用于瑞典语情感分析的语言模型。这两个模型基于 KB/bert-base-swedish-cased 模型,并针对多标签情感分析任务进行了微调。
这些模型针对恐惧和暴力两种情感进行了微调。模型会输出三个浮点数,分别对应索引处的“负面”“弱情感”和“强情感”标签。
这些模型使用了来自各种互联网来源和论坛的、以对话为重点的瑞典语数据进行训练。
模型仅在瑞典语数据上进行训练,仅支持对瑞典语输入文本进行推理。对于所有非瑞典语输入,模型的推理指标未定义,这些输入被视为域外数据。
当前模型支持 Transformers 版本 >= 4.3.3 和 Torch 版本 1.8.0,与旧版本的兼容性未经验证。
✨ 主要特性
- 基于成熟的瑞典语BERT模型微调,适用于多标签情感分析。
- 针对恐惧和暴力两种情感进行了专门的训练。
- 输出结果对应“负面”“弱情感”和“强情感”三个标签。
📦 安装指南
由于文档中未明确提及安装步骤,此部分跳过。
💻 使用示例
基础用法
瑞典语情感恐惧模型(Swedish-Sentiment-Fear)
from transformers import BertForSequenceClassification, BertTokenizerFast
tokenizer = BertTokenizerFast.from_pretrained("RecordedFuture/Swedish-Sentiment-Fear")
classifier_fear = BertForSequenceClassification.from_pretrained("RecordedFuture/Swedish-Sentiment-Fear")
当模型和分词器初始化完成后,即可用于推理。
瑞典语情感暴力模型(Swedish-Sentiment-Violence)
from transformers import BertForSequenceClassification, BertTokenizerFast
tokenizer = BertTokenizerFast.from_pretrained("RecordedFuture/Swedish-Sentiment-Violence")
classifier_violence = BertForSequenceClassification.from_pretrained("RecordedFuture/Swedish-Sentiment-Violence")
当模型和分词器初始化完成后,即可用于推理。
📚 详细文档
情感定义
强情感包括但不限于以下文本:
弱情感包括但不限于以下文本:
验证指标
瑞典语情感恐惧模型(Swedish-Sentiment-Fear)
在训练过程中,模型在以下分类断点处达到了最大验证指标:
分类断点 |
F值 |
精确率 |
召回率 |
0.45 |
0.8754 |
0.8618 |
0.8895 |
瑞典语情感暴力模型(Swedish-Sentiment-Violence)
强情感包括但不限于以下文本:
弱情感包括但不限于以下文本:
验证指标
在训练过程中,模型在以下分类断点处达到了最大验证指标:
分类断点 |
F值 |
精确率 |
召回率 |
0.35 |
0.7677 |
0.7456 |
0.791 |
📄 许可证
本项目采用 MIT 许可证。