🚀 基於斯洛伐克BERT的情感分析模型
本項目是一個基於 斯洛伐克BERT 的情感分析分類器。該模型能夠區分三種情感等級:
-1
- 負面情感
0
- 中性情感
1
- 正面情感
該模型使用 多語言推特情感分析數據集 [Mozetič等人,2016年] 中的斯洛伐克語部分進行微調,該部分包含50000條手動標註的斯洛伐克語推文。因此,該模型是針對推文進行微調的,不建議將其用於通用的情感分析。
✨ 主要特性
- 基於斯洛伐克BERT模型,能夠對斯洛伐克語內容進行情感分析。
- 可區分三種情感等級:負面、中性和正面。
- 針對斯洛伐克語推文進行了微調。
📚 詳細文檔
結果
該模型在 我們的論文 [Pikuliak等人,2021年,第4.4節] 中進行了評估。在原始數據集上,該模型的F1分數達到了 \(0.67\);在通用評論數據集上,F1分數為 \(0.58\)。
引用
如果您使用了該模型,請引用以下論文:
@inproceedings{pikuliak-etal-2022-slovakbert,
title = "{S}lovak{BERT}: {S}lovak Masked Language Model",
author = "Pikuliak, Mat{\'u}{\v{s}} and
Grivalsk{\'y}, {\v{S}}tefan and
Kon{\^o}pka, Martin and
Bl{\v{s}}t{\'a}k, Miroslav and
Tamajka, Martin and
Bachrat{\'y}, Viktor and
Simko, Marian and
Bal{\'a}{\v{z}}ik, Pavol and
Trnka, Michal and
Uhl{\'a}rik, Filip",
booktitle = "Findings of the Association for Computational Linguistics: EMNLP 2022",
month = dec,
year = "2022",
address = "Abu Dhabi, United Arab Emirates",
publisher = "Association for Computational Linguistics",
url = "https://aclanthology.org/2022.findings-emnlp.530",
pages = "7156--7168",
abstract = "We introduce a new Slovak masked language model called \textit{SlovakBERT}. This is to our best knowledge the first paper discussing Slovak transformers-based language models. We evaluate our model on several NLP tasks and achieve state-of-the-art results. This evaluation is likewise the first attempt to establish a benchmark for Slovak language models. We publish the masked language model, as well as the fine-tuned models for part-of-speech tagging, sentiment analysis and semantic textual similarity.",
}
📄 許可證
本項目採用CC(Creative Commons)許可證。
屬性 |
詳情 |
標籤 |
twitter, sentiment-analysis |
指標 |
f1 |
示例文本 |
- Najkrajšia vianočná reklama: Toto milé video vám vykúzli čarovnú atmosféru: Vianoce sa nezadržateľne blížia. - A opäť sa objavili nebezpečné výrobky. Pozrite sa, či ich nemáte doma |
模型類型 |
基於斯洛伐克BERT的情感分析分類器 |
訓練數據 |
多語言推特情感分析數據集的斯洛伐克語部分,包含50000條手動標註的斯洛伐克語推文 |