🚀 用於情感分析的瑞典語BERT模型
Recorded Future 與 AI Sweden 聯合發佈了兩個用於瑞典語情感分析的語言模型。這兩個模型基於 KB/bert-base-swedish-cased 模型,並針對多標籤情感分析任務進行了微調。
這些模型針對恐懼和暴力兩種情感進行了微調。模型會輸出三個浮點數,分別對應索引處的“負面”“弱情感”和“強情感”標籤。
這些模型使用了來自各種互聯網來源和論壇的、以對話為重點的瑞典語數據進行訓練。
模型僅在瑞典語數據上進行訓練,僅支持對瑞典語輸入文本進行推理。對於所有非瑞典語輸入,模型的推理指標未定義,這些輸入被視為域外數據。
當前模型支持 Transformers 版本 >= 4.3.3 和 Torch 版本 1.8.0,與舊版本的兼容性未經驗證。
✨ 主要特性
- 基於成熟的瑞典語BERT模型微調,適用於多標籤情感分析。
- 針對恐懼和暴力兩種情感進行了專門的訓練。
- 輸出結果對應“負面”“弱情感”和“強情感”三個標籤。
📦 安裝指南
由於文檔中未明確提及安裝步驟,此部分跳過。
💻 使用示例
基礎用法
瑞典語情感恐懼模型(Swedish-Sentiment-Fear)
from transformers import BertForSequenceClassification, BertTokenizerFast
tokenizer = BertTokenizerFast.from_pretrained("RecordedFuture/Swedish-Sentiment-Fear")
classifier_fear = BertForSequenceClassification.from_pretrained("RecordedFuture/Swedish-Sentiment-Fear")
當模型和分詞器初始化完成後,即可用於推理。
瑞典語情感暴力模型(Swedish-Sentiment-Violence)
from transformers import BertForSequenceClassification, BertTokenizerFast
tokenizer = BertTokenizerFast.from_pretrained("RecordedFuture/Swedish-Sentiment-Violence")
classifier_violence = BertForSequenceClassification.from_pretrained("RecordedFuture/Swedish-Sentiment-Violence")
當模型和分詞器初始化完成後,即可用於推理。
📚 詳細文檔
情感定義
強情感包括但不限於以下文本:
弱情感包括但不限於以下文本:
驗證指標
瑞典語情感恐懼模型(Swedish-Sentiment-Fear)
在訓練過程中,模型在以下分類斷點處達到了最大驗證指標:
分類斷點 |
F值 |
精確率 |
召回率 |
0.45 |
0.8754 |
0.8618 |
0.8895 |
瑞典語情感暴力模型(Swedish-Sentiment-Violence)
強情感包括但不限於以下文本:
弱情感包括但不限於以下文本:
驗證指標
在訓練過程中,模型在以下分類斷點處達到了最大驗證指標:
分類斷點 |
F值 |
精確率 |
召回率 |
0.35 |
0.7677 |
0.7456 |
0.791 |
📄 許可證
本項目採用 MIT 許可證。