🚀 印尼語RoBERTa情感分類器
印尼語RoBERTa情感分類器是一個基於Indo - roberta模型的情感分類器。它在IndoNLU EmoT數據集上進行訓練。所使用的模型為Indo - roberta,並通過遷移學習轉換為情感分類器模型。根據IndoNLU基準測試,該模型的F1 - 宏平均得分為72.05%,準確率為71.81%,精確率為72.47%,召回率為71.94%。
✨ 主要特性
- 基於Indo - roberta模型,在IndoNLU EmoT數據集上訓練。
- 經過遷移學習,從預訓練模型轉換為情感分類器。
- 在IndoNLU基準測試中取得了較好的評估指標。
📦 安裝指南
文檔未提及安裝步驟,暫不展示。
💻 使用示例
基礎用法
from transformers import pipeline
pretrained_name = "StevenLimcorn/indonesian-roberta-base-emotion-classifier"
nlp = pipeline(
"sentiment-analysis",
model=pretrained_name,
tokenizer=pretrained_name
)
nlp("Hal-hal baik akan datang.")
📚 詳細文檔
模型
該模型在7個訓練週期中進行訓練,學習率為2e - 5。取得的各項指標如下所示:
訓練週期 |
訓練損失 |
驗證損失 |
準確率 |
F1值 |
精確率 |
召回率 |
1 |
1.300700 |
1.005149 |
0.622727 |
0.601846 |
0.640845 |
0.611144 |
2 |
0.806300 |
0.841953 |
0.686364 |
0.694096 |
0.701984 |
0.696657 |
3 |
0.591900 |
0.796794 |
0.686364 |
0.696573 |
0.707520 |
0.691671 |
4 |
0.441200 |
0.782094 |
0.722727 |
0.724359 |
0.725985 |
0.730229 |
5 |
0.334700 |
0.809931 |
0.711364 |
0.720550 |
0.718318 |
0.724608 |
6 |
0.268400 |
0.812771 |
0.718182 |
0.724192 |
0.721222 |
0.729195 |
7 |
0.226000 |
0.828461 |
0.725000 |
0.733625 |
0.731709 |
0.735800 |
注意事項
請考慮預訓練的RoBERTa模型和EmoT
數據集可能存在的偏差,這些偏差可能會影響該模型的預測結果。
作者信息
印尼語RoBERTa基礎情感分類器由Steven Limcorn進行訓練和評估。所有的計算和開發工作均在Google Colaboratory上使用其免費GPU完成。
如果使用該模型,請引用以下文獻:
@misc {steven_limcorn_2023,
author = { {Steven Limcorn} },
title = { indonesian-roberta-base-emotion-classifier (Revision e8a9cb9) },
year = 2023,
url = { https://huggingface.co/StevenLimcorn/indonesian-roberta-base-emotion-classifier },
doi = { 10.57967/hf/0681 },
publisher = { Hugging Face }
}
📄 許可證
本項目採用MIT許可證。
屬性 |
詳情 |
模型類型 |
基於Indo - roberta的情感分類器 |
訓練數據 |
IndoNLU EmoT數據集 |