PopBERT开源德语民粹主义检测模型 - 精准识别德国联邦议会演讲倾向

首页

Popbert

由 luerhard 开发

PopBERT是一个基于deepset/gbert-large模型开发的德语政治演讲民粹主义检测模型，专门针对德国联邦议会的政治演讲内容。

文本分类

Transformers

德语开源协议:MIT #德语政治文本分析 #民粹主义检测 #多标签分类

下载量 409

发布时间 : 8/11/2023

模型简介

PopBERT是一个多标签分类模型，用于检测德语政治演讲中的民粹主义维度及其意识形态倾向。

模型特点

民粹主义维度检测

能够识别政治演讲中的反精英主义和人民中心主义维度。

意识形态倾向识别

可区分民粹主义背后的左翼或右翼宿主意识形态。

专业领域优化

专门针对德国联邦议会政治演讲内容进行训练和优化。

模型能力

德语文本分类

政治演讲分析

民粹主义检测

意识形态倾向识别

使用案例

政治分析

议会演讲分析

分析德国联邦议会演讲中的民粹主义内容和意识形态倾向。

可识别反精英主义、人民中心主义及左右翼意识形态特征。

政治立场监测

监测政治人物或政党演讲中的民粹主义倾向变化。

提供量化的民粹主义维度评分和意识形态倾向概率。

学术研究

民粹主义研究

支持政治学和传播学领域的民粹主义定量研究。

提供标准化的民粹主义维度检测工具。

🚀 PopBERT

PopBERT是一个用于检测德国联邦议院政治演讲中德语民粹主义的模型，它基于deepset/gbert-large模型：https://huggingface.co/deepset/gbert-large 。该模型能够解决在德语政治演讲中识别民粹主义相关特征的问题，为政治文本分析提供了有力支持。

🚀 快速开始

PopBERT是一个用于检测德国联邦议院政治演讲中德语民粹主义的模型，基于deepset/gbert-large模型。它是一个多标签模型，在第18和第19立法期的手动整理句子数据集上进行训练。除了捕捉民粹主义的基本维度，即“反精英主义”和“以人民为中心”之外，该模型还经过微调，以识别潜在的意识形态倾向是“左翼”还是“右翼”。

✨ 主要特性

基于deepset/gbert-large模型，用于检测德国联邦议院政治演讲中的德语民粹主义。
多标签模型，可识别“反精英主义”“以人民为中心”“左翼”和“右翼”等维度。
在手动整理的数据集上训练，能更精准地捕捉民粹主义特征。

📦 安装指南

此文档未提及具体安装步骤，若需使用该模型，可参考transformers库的安装方法。

💻 使用示例

基础用法

import torch
from transformers import AutoModelForSequenceClassification
from transformers import AutoTokenizer

# load tokenizer
tokenizer = AutoTokenizer.from_pretrained("luerhard/PopBERT")

# load model
model = AutoModelForSequenceClassification.from_pretrained("luerhard/PopBERT")

# define text to be predicted
text = (
    "Das ist Klassenkampf von oben, das ist Klassenkampf im Interesse von "
    "Vermögenden und Besitzenden gegen die Mehrheit der Steuerzahlerinnen und "
    "Steuerzahler auf dieser Erde."
)

# encode text with tokenizer
encodings = tokenizer(text, return_tensors="pt")

# predict
with torch.inference_mode():
    out = model(**encodings)

# get probabilties
probs = torch.nn.functional.sigmoid(out.logits)
print(probs.detach().numpy())

运行上述代码后，输出结果如下：

[[0.8765146  0.34838045 0.983123   0.02148379]]

高级用法

为了最大化性能，建议针对每个维度使用以下阈值：

[0.415961, 0.295400, 0.429109, 0.302714]

使用这些阈值，模型在测试集上达到以下性能：

维度	精确率	召回率	F1值
反精英主义	0.81	0.88	0.84
以人民为中心	0.70	0.73	0.71
左翼意识形态	0.69	0.77	0.73
右翼意识形态	0.68	0.66	0.67
---	---	---	---
微平均	0.75	0.80	0.77
宏平均	0.72	0.76	0.74