🚀 德語零樣本分類模型
本模型是一個零樣本分類模型,基於 deepset/gbert-large 在 facebook/xnli
德語數據集上微調而來,可用於德語的零樣本分類任務,在評估集上有較好的表現。
🚀 快速開始
本模型是 deepset/gbert-large 在 facebook/xnli
德語數據集上的微調版本。它在評估集上取得了以下結果:
💻 使用示例
基礎用法
import torch
from transformers import pipeline
pipe = pipeline(
"zero-shot-classification",
model="kaixkhazaki/german-zeroshot",
tokenizer="kaixkhazaki/german-zeroshot",
device=0 if torch.cuda.is_available() else -1
)
sequence = "Können Sie mir die Schritte zur Konfiguration eines VPN auf einem Linux-Server erklären?"
candidate_labels = [
"Technische Dokumentation",
"IT-Support",
"Netzwerkadministration",
"Linux-Konfiguration",
"VPN-Setup"
]
pipe(sequence,candidate_labels)
>>
{'sequence': 'Können Sie mir die Schritte zur Konfiguration eines VPN auf einem Linux-Server erklären?',
'labels': ['VPN-Setup', 'Linux-Konfiguration', 'Netzwerkadministration', 'IT-Support', 'Technische Dokumentation'],
'scores': [0.53142249584198, 0.26030370593070984, 0.09126164764165878, 0.06451434642076492, 0.052497804164886475]}
sequence = "Wie lautet die Garantiezeit für dieses Produkt?"
candidate_labels = [
"Garantiebedingungen",
"Kundendienst",
"Produktdetails",
"Reklamation",
"Kaufberatung"
]
pipe(sequence,candidate_labels)
>>
{'sequence': 'Wie lautet die Garantiezeit für dieses Produkt?',
'labels': ['Garantiebedingungen', 'Kundendienst', 'Produktdetails', 'Reklamation', 'Kaufberatung'],
'scores': [0.414899080991745, 0.2377401739358902, 0.1381743848323822, 0.12171833217144012, 0.08746808022260666]}
🔧 技術細節
訓練超參數
訓練過程中使用了以下超參數:
- 學習率:5e-05
- 訓練批次大小:64
- 評估批次大小:32
- 隨機種子:42
- 優化器:使用
adamw_torch
,betas=(0.9, 0.999)
,epsilon=1e-08
,無額外優化器參數
- 學習率調度器類型:餘弦
- 學習率調度器熱身步數:500
- 訓練輪數:3
訓練結果
訓練損失 |
輪數 |
步數 |
驗證損失 |
準確率 |
F1值 |
精確率 |
召回率 |
0.6429 |
0.1630 |
1000 |
0.5203 |
0.8004 |
0.8006 |
0.8009 |
0.8004 |
0.5715 |
0.3259 |
2000 |
0.5209 |
0.7964 |
0.7968 |
0.8005 |
0.7964 |
0.5897 |
0.4889 |
3000 |
0.5435 |
0.7924 |
0.7940 |
0.8039 |
0.7924 |
0.5701 |
0.6519 |
4000 |
0.5242 |
0.7880 |
0.7884 |
0.8078 |
0.7880 |
0.5238 |
0.8149 |
5000 |
0.4816 |
0.8233 |
0.8226 |
0.8263 |
0.8233 |
0.5285 |
0.9778 |
6000 |
0.4483 |
0.8265 |
0.8273 |
0.8303 |
0.8265 |
0.4302 |
1.1408 |
7000 |
0.4751 |
0.8209 |
0.8214 |
0.8277 |
0.8209 |
0.4163 |
1.3038 |
8000 |
0.4560 |
0.8285 |
0.8289 |
0.8344 |
0.8285 |
0.3942 |
1.4668 |
9000 |
0.4330 |
0.8414 |
0.8422 |
0.8454 |
0.8414 |
0.3875 |
1.6297 |
10000 |
0.4171 |
0.8430 |
0.8432 |
0.8455 |
0.8430 |
0.3639 |
1.7927 |
11000 |
0.4194 |
0.8442 |
0.8447 |
0.8487 |
0.8442 |
0.3768 |
1.9557 |
12000 |
0.4215 |
0.8474 |
0.8477 |
0.8492 |
0.8474 |
0.2443 |
2.1186 |
13000 |
0.4750 |
0.8390 |
0.8398 |
0.8452 |
0.8390 |
0.2404 |
2.2816 |
14000 |
0.4592 |
0.8486 |
0.8487 |
0.8505 |
0.8486 |
0.2154 |
2.4446 |
15000 |
0.4914 |
0.8418 |
0.8424 |
0.8466 |
0.8418 |
0.2157 |
2.6076 |
16000 |
0.4804 |
0.8454 |
0.8458 |
0.8488 |
0.8454 |
0.2249 |
2.7705 |
17000 |
0.4809 |
0.8466 |
0.8471 |
0.8507 |
0.8466 |
0.2204 |
2.9335 |
18000 |
0.4777 |
0.8466 |
0.8470 |
0.8502 |
0.8466 |
框架版本
- Transformers 4.48.0.dev0
- Pytorch 2.4.1+cu121
- Datasets 3.1.0
- Tokenizers 0.21.0
📄 許可證
本模型採用 MIT 許可證。
屬性 |
詳情 |
模型類型 |
零樣本分類模型 |
訓練數據 |
facebook/xnli 德語數據集 |
基礎模型 |
deepset/gbert-large |
指標 |
準確率 |
標籤 |
由訓練器生成、德語 |
管道標籤 |
零樣本分類 |