german-zeroshot开源零样本分类模型 - 支持德语数据免费分类应用

首页

German Zeroshot

由 kaixkhazaki 开发

基于deepset/gbert-large在facebook/xnli德语数据集上微调的零样本分类模型

文本分类

Transformers

德语开源协议:MIT #德语零样本分类 #高准确率 #XNLI微调

下载量 65

发布时间 : 1/8/2025

模型简介

该模型是一个德语零样本分类模型，能够在没有特定任务训练的情况下对文本进行分类。适用于多类别文本分类任务。

模型特点

德语零样本分类

无需特定任务训练即可对德语文本进行分类

高准确率

在评估集上达到84.86%的准确率

基于GBERT-large

使用强大的德语预训练模型作为基础

模型能力

德语文本分类

零样本学习

多类别分类

使用案例

客户支持

自动工单分类

将客户咨询自动分类到正确的支持类别

提高支持效率，减少人工分类时间

内容管理

文档分类

对德语文档进行自动分类

实现文档的自动组织和检索

🚀 德语零样本分类模型

本模型是一个零样本分类模型，基于 deepset/gbert-large 在 facebook/xnli 德语数据集上微调而来，可用于德语的零样本分类任务，在评估集上有较好的表现。

🚀 快速开始

本模型是 deepset/gbert-large 在 facebook/xnli 德语数据集上的微调版本。它在评估集上取得了以下结果：

损失值：0.4592
准确率：0.8486

💻 使用示例

基础用法

# Use a pipeline as a high-level helper
import torch
from transformers import pipeline

pipe = pipeline(
    "zero-shot-classification",
    model="kaixkhazaki/german-zeroshot",
    tokenizer="kaixkhazaki/german-zeroshot",
    device=0 if torch.cuda.is_available() else -1  # Use GPU if available
)

#Enter your text and possible candidates of classification
sequence = "Können Sie mir die Schritte zur Konfiguration eines VPN auf einem Linux-Server erklären?"
candidate_labels = [
    "Technische Dokumentation", 
    "IT-Support", 
    "Netzwerkadministration", 
    "Linux-Konfiguration", 
    "VPN-Setup"
]
pipe(sequence,candidate_labels)
>>
{'sequence': 'Können Sie mir die Schritte zur Konfiguration eines VPN auf einem Linux-Server erklären?',
'labels': ['VPN-Setup', 'Linux-Konfiguration', 'Netzwerkadministration', 'IT-Support', 'Technische Dokumentation'],
'scores': [0.53142249584198, 0.26030370593070984, 0.09126164764165878, 0.06451434642076492, 0.052497804164886475]}


#example 2
sequence = "Wie lautet die Garantiezeit für dieses Produkt?"
candidate_labels = [
    "Garantiebedingungen", 
    "Kundendienst", 
    "Produktdetails", 
    "Reklamation", 
    "Kaufberatung"
]
pipe(sequence,candidate_labels)
>>
{'sequence': 'Wie lautet die Garantiezeit für dieses Produkt?',
'labels': ['Garantiebedingungen', 'Kundendienst', 'Produktdetails', 'Reklamation', 'Kaufberatung'],
'scores': [0.414899080991745, 0.2377401739358902, 0.1381743848323822, 0.12171833217144012, 0.08746808022260666]}

🔧 技术细节

训练超参数

训练过程中使用了以下超参数：

学习率：5e-05
训练批次大小：64
评估批次大小：32
随机种子：42
优化器：使用 adamw_torch，betas=(0.9, 0.999)，epsilon=1e-08，无额外优化器参数
学习率调度器类型：余弦
学习率调度器热身步数：500
训练轮数：3

训练结果

训练损失	轮数	步数	验证损失	准确率	F1值	精确率	召回率
0.6429	0.1630	1000	0.5203	0.8004	0.8006	0.8009	0.8004
0.5715	0.3259	2000	0.5209	0.7964	0.7968	0.8005	0.7964
0.5897	0.4889	3000	0.5435	0.7924	0.7940	0.8039	0.7924
0.5701	0.6519	4000	0.5242	0.7880	0.7884	0.8078	0.7880
0.5238	0.8149	5000	0.4816	0.8233	0.8226	0.8263	0.8233
0.5285	0.9778	6000	0.4483	0.8265	0.8273	0.8303	0.8265
0.4302	1.1408	7000	0.4751	0.8209	0.8214	0.8277	0.8209
0.4163	1.3038	8000	0.4560	0.8285	0.8289	0.8344	0.8285
0.3942	1.4668	9000	0.4330	0.8414	0.8422	0.8454	0.8414
0.3875	1.6297	10000	0.4171	0.8430	0.8432	0.8455	0.8430
0.3639	1.7927	11000	0.4194	0.8442	0.8447	0.8487	0.8442
0.3768	1.9557	12000	0.4215	0.8474	0.8477	0.8492	0.8474
0.2443	2.1186	13000	0.4750	0.8390	0.8398	0.8452	0.8390
0.2404	2.2816	14000	0.4592	0.8486	0.8487	0.8505	0.8486
0.2154	2.4446	15000	0.4914	0.8418	0.8424	0.8466	0.8418
0.2157	2.6076	16000	0.4804	0.8454	0.8458	0.8488	0.8454
0.2249	2.7705	17000	0.4809	0.8466	0.8471	0.8507	0.8466
0.2204	2.9335	18000	0.4777	0.8466	0.8470	0.8502	0.8466

框架版本

Transformers 4.48.0.dev0
Pytorch 2.4.1+cu121
Datasets 3.1.0
Tokenizers 0.21.0

📄 许可证

本模型采用 MIT 许可证。

属性	详情
模型类型	零样本分类模型
训练数据	facebook/xnli 德语数据集
基础模型	deepset/gbert-large
指标	准确率
标签	由训练器生成、德语
管道标签	零样本分类