german-zeroshotオープンソース零サンプル分類モデル - ドイツ語データの無料分類アプリケーションをサポート

ホーム

German Zeroshot

kaixkhazakiによって開発

deepset/gbert-largeをfacebook/xnliドイツ語データセットでファインチューニングしたゼロショット分類モデル

テキスト分類

Transformers

ドイツ語オープンソースライセンス:MIT #ドイツ語ゼロショット分類 #高精度 #XNLIファインチューニング

ダウンロード数 65

リリース時間 : 1/8/2025

モデル概要

このモデルはドイツ語のゼロショット分類モデルで、特定のタスク訓練なしにテキストを分類できます。多クラステキスト分類タスクに適しています。

モデル特徴

ドイツ語ゼロショット分類

特定のタスク訓練なしでドイツ語テキストを分類可能

高精度

評価データセットで84.86%の精度を達成

GBERT-largeベース

強力なドイツ語事前学習モデルを基盤に使用

モデル能力

ドイツ語テキスト分類

ゼロショット学習

多クラス分類

使用事例

カスタマーサポート

自動チケット分類

顧客問い合わせを適切なサポートカテゴリに自動分類

サポート効率向上、手動分類時間削減

コンテンツ管理

ドキュメント分類

ドイツ語ドキュメントを自動分類

ドキュメントの自動整理と検索を実現

🚀 ドイツ語ゼロショットモデル

このモデルは、ドイツ語のゼロショット分類に特化したモデルです。deepset/gbert-large を facebook/xnli のドイツ語データセットでファインチューニングしています。評価セットでは、損失0.4592、精度0.8486を達成しています。

🚀 クイックスタート

このモデルは、ゼロショット分類タスクに使用できます。以下のコード例を参考に、簡単に使い始めることができます。

💻 使用例

基本的な使用法

# Use a pipeline as a high-level helper

pipe = pipeline(
    "zero-shot-classification",
    model="kaixkhazaki/german-zeroshot",
    tokenizer="kaixkhazaki/german-zeroshot",
    device=0 if torch.cuda.is_available() else -1  # Use GPU if available
)

#Enter your text and possible candidates of classification
sequence = "Können Sie mir die Schritte zur Konfiguration eines VPN auf einem Linux-Server erklären?"
candidate_labels = [
    "Technische Dokumentation", 
    "IT-Support", 
    "Netzwerkadministration", 
    "Linux-Konfiguration", 
    "VPN-Setup"
]
pipe(sequence,candidate_labels)
>>
{'sequence': 'Können Sie mir die Schritte zur Konfiguration eines VPN auf einem Linux-Server erklären?',
'labels': ['VPN-Setup', 'Linux-Konfiguration', 'Netzwerkadministration', 'IT-Support', 'Technische Dokumentation'],
'scores': [0.53142249584198, 0.26030370593070984, 0.09126164764165878, 0.06451434642076492, 0.052497804164886475]}


#example 2
sequence = "Wie lautet die Garantiezeit für dieses Produkt?"
candidate_labels = [
    "Garantiebedingungen", 
    "Kundendienst", 
    "Produktdetails", 
    "Reklamation", 
    "Kaufberatung"
]
pipe(sequence,candidate_labels)
>>
{'sequence': 'Wie lautet die Garantiezeit für dieses Produkt?',
'labels': ['Garantiebedingungen', 'Kundendienst', 'Produktdetails', 'Reklamation', 'Kaufberatung'],
'scores': [0.414899080991745, 0.2377401739358902, 0.1381743848323822, 0.12171833217144012, 0.08746808022260666]}

📚 ドキュメント

モデルの説明

このモデルは、deepset/gbert-large を facebook/xnli のドイツ語データセットでファインチューニングしたものです。ゼロショット分類タスクに特化しています。

想定される用途と制限事項

このモデルは、ドイツ語のテキストをゼロショット分類するために設計されています。ただし、特定のドメインや文脈においては、性能が低下する可能性があります。

学習と評価データ

このモデルは、facebook/xnli のドイツ語データセットを使用して学習されました。

学習手順

学習ハイパーパラメータ

学習時には、以下のハイパーパラメータが使用されました。

learning_rate: 5e-05
train_batch_size: 64
eval_batch_size: 32
seed: 42
optimizer: Use adamw_torch with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
lr_scheduler_type: cosine
lr_scheduler_warmup_steps: 500
num_epochs: 3

学習結果

学習損失	エポック	ステップ	検証損失	精度	F1値	適合率	再現率
0.6429	0.1630	1000	0.5203	0.8004	0.8006	0.8009	0.8004
0.5715	0.3259	2000	0.5209	0.7964	0.7968	0.8005	0.7964
0.5897	0.4889	3000	0.5435	0.7924	0.7940	0.8039	0.7924
0.5701	0.6519	4000	0.5242	0.7880	0.7884	0.8078	0.7880
0.5238	0.8149	5000	0.4816	0.8233	0.8226	0.8263	0.8233
0.5285	0.9778	6000	0.4483	0.8265	0.8273	0.8303	0.8265
0.4302	1.1408	7000	0.4751	0.8209	0.8214	0.8277	0.8209
0.4163	1.3038	8000	0.4560	0.8285	0.8289	0.8344	0.8285
0.3942	1.4668	9000	0.4330	0.8414	0.8422	0.8454	0.8414
0.3875	1.6297	10000	0.4171	0.8430	0.8432	0.8455	0.8430
0.3639	1.7927	11000	0.4194	0.8442	0.8447	0.8487	0.8442
0.3768	1.9557	12000	0.4215	0.8474	0.8477	0.8492	0.8474
0.2443	2.1186	13000	0.4750	0.8390	0.8398	0.8452	0.8390
0.2404	2.2816	14000	0.4592	0.8486	0.8487	0.8505	0.8486
0.2154	2.4446	15000	0.4914	0.8418	0.8424	0.8466	0.8418
0.2157	2.6076	16000	0.4804	0.8454	0.8458	0.8488	0.8454
0.2249	2.7705	17000	0.4809	0.8466	0.8471	0.8507	0.8466
0.2204	2.9335	18000	0.4777	0.8466	0.8470	0.8502	0.8466