slovakbert - sentiment - twitter開源模型 - 免費部署分析斯洛伐克語推文情感

首頁

Slovakbert Sentiment Twitter

由kinit開發

這是一個基於SlovakBERT的情感分析分類器，專為斯洛伐克語推文優化，可區分負面、中性和積極三種情感級別。

文本分類

Transformers

其他開源協議:CC #斯洛伐克語情感分析 #推特文本優化 #三分類情感

下載量 154

發布時間 : 3/2/2022

模型概述

該模型使用多語言推特情感分析數據集中的斯洛伐克語部分進行微調，包含5萬條人工標註的斯洛伐克推文，適用於推文情感分析場景。

模型特點

推特優化

專為斯洛伐克語推文優化，不適合通用情感分析場景

三分類情感分析

能準確區分負面(-1)、中性(0)和積極(1)三種情感級別

高質量訓練數據

基於5萬條人工標註的斯洛伐克推文進行微調

模型能力

斯洛伐克語文本分析

推文情感分類

三分類情感識別

使用案例

社交媒體分析

推文情感監測

分析斯洛伐克語推文的情感傾向

在原數據集上獲得F1分數0.67

🚀 基於斯洛伐克BERT的情感分析模型

本項目是一個基於斯洛伐克BERT 的情感分析分類器。該模型能夠區分三種情感等級：

-1 - 負面情感
0 - 中性情感
1 - 正面情感

該模型使用多語言推特情感分析數據集 [Mozetič等人，2016年] 中的斯洛伐克語部分進行微調，該部分包含50000條手動標註的斯洛伐克語推文。因此，該模型是針對推文進行微調的，不建議將其用於通用的情感分析。

✨ 主要特性

基於斯洛伐克BERT模型，能夠對斯洛伐克語內容進行情感分析。
可區分三種情感等級：負面、中性和正面。
針對斯洛伐克語推文進行了微調。

📚 詳細文檔

結果

該模型在我們的論文 [Pikuliak等人，2021年，第4.4節] 中進行了評估。在原始數據集上，該模型的F1分數達到了 \(0.67\)；在通用評論數據集上，F1分數為 \(0.58\)。

引用

如果您使用了該模型，請引用以下論文：

@inproceedings{pikuliak-etal-2022-slovakbert,
    title = "{S}lovak{BERT}: {S}lovak Masked Language Model",
    author = "Pikuliak, Mat{\'u}{\v{s}}  and
      Grivalsk{\'y}, {\v{S}}tefan  and
      Kon{\^o}pka, Martin  and
      Bl{\v{s}}t{\'a}k, Miroslav  and
      Tamajka, Martin  and
      Bachrat{\'y}, Viktor  and
      Simko, Marian  and
      Bal{\'a}{\v{z}}ik, Pavol  and
      Trnka, Michal  and
      Uhl{\'a}rik, Filip",
    booktitle = "Findings of the Association for Computational Linguistics: EMNLP 2022",
    month = dec,
    year = "2022",
    address = "Abu Dhabi, United Arab Emirates",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/2022.findings-emnlp.530",
    pages = "7156--7168",
    abstract = "We introduce a new Slovak masked language model called \textit{SlovakBERT}. This is to our best knowledge the first paper discussing Slovak transformers-based language models. We evaluate our model on several NLP tasks and achieve state-of-the-art results. This evaluation is likewise the first attempt to establish a benchmark for Slovak language models. We publish the masked language model, as well as the fine-tuned models for part-of-speech tagging, sentiment analysis and semantic textual similarity.",
}

📄 許可證

本項目採用CC（Creative Commons）許可證。

屬性	詳情
標籤	twitter, sentiment-analysis
指標	f1
示例文本	- Najkrajšia vianočná reklama: Toto milé video vám vykúzli čarovnú atmosféru: Vianoce sa nezadržateľne blížia. - A opäť sa objavili nebezpečné výrobky. Pozrite sa, či ich nemáte doma
模型類型	基於斯洛伐克BERT的情感分析分類器
訓練數據	多語言推特情感分析數據集的斯洛伐克語部分，包含50000條手動標註的斯洛伐克語推文