🚀 ドイツ語ゼロショット
このモデルは、テキスト分類タスクに特化したもので、ドイツ語のテキストに対してゼロショット分類を行うことができます。XNLIデータセットを用いてファインチューニングされており、高い精度を発揮します。
🚀 クイックスタート
このモデルを使用するには、以下の手順に従ってください。まず、必要なライブラリをインポートし、パイプラインを初期化します。その後、分類したいテキストと候補ラベルを指定して、モデルを実行します。
from transformers import pipeline
classifier = pipeline("zero-shot-classification",
model="Sahajtomar/German_Zeroshot")
sequence = "Letzte Woche gab es einen Selbstmord in einer nahe gelegenen kolonie"
candidate_labels = ["Verbrechen","Tragödie","Stehlen"]
hypothesis_template = "In deisem geht es um {}."
classifier(sequence, candidate_labels, hypothesis_template=hypothesis_template)
"""{'labels': ['Tragödie', 'Verbrechen', 'Stehlen'],
'scores': [0.8328856854438782, 0.10494536352157593, 0.06316883927583696],
'sequence': 'Letzte Woche gab es einen Selbstmord in einer nahe gelegenen Kolonie'}"""
✨ 主な機能
- 高精度な分類:XNLIデータセットでファインチューニングされており、ドイツ語のテキスト分類に高い精度を発揮します。
- ゼロショット分類:事前に学習していないクラスに対しても分類が可能です。
- 仮説テンプレートの指定:仮説テンプレートを指定することで、分類結果を柔軟に調整できます。
📚 ドキュメント
モデルの説明
このモデルは、GBERT Large をベースモデルとして使用し、xnli deデータセットでファインチューニングされています。デフォルトの仮説テンプレートは英語で This text is {}
です。このモデルを使用する際には、「In deisem geht es um {}」などに変更する必要があります。Hugging Face APIを介して推論を行うと、デフォルトで英語のテンプレートが使用されるため、結果が悪くなることがあります。このモデルは単言語モデルであり、多言語モデルではないため、仮説テンプレートを適切に変更する必要があります。
精度評価
XNLI DEV (ドイツ語)
精度: 85.5
XNLI TEST (ドイツ語)
精度: 83.6
ゼロショット分類パイプライン
以下は、ゼロショット分類パイプラインを使用したコード例です。
from transformers import pipeline
classifier = pipeline("zero-shot-classification",
model="Sahajtomar/German_Zeroshot")
sequence = "Letzte Woche gab es einen Selbstmord in einer nahe gelegenen kolonie"
candidate_labels = ["Verbrechen","Tragödie","Stehlen"]
hypothesis_template = "In deisem geht es um {}."
classifier(sequence, candidate_labels, hypothesis_template=hypothesis_template)
"""{'labels': ['Tragödie', 'Verbrechen', 'Stehlen'],
'scores': [0.8328856854438782, 0.10494536352157593, 0.06316883927583696],
'sequence': 'Letzte Woche gab es einen Selbstmord in einer nahe gelegenen Kolonie'}"""
情報テーブル
属性 |
詳細 |
モデルタイプ |
ゼロショット分類モデル |
訓練データ |
xnli deデータセット |
重要提示
⚠️ 重要提示
このモデルは単言語モデルであり、仮説テンプレートを適切に変更する必要があります。Hugging Face APIを介して推論を行う際には、デフォルトで英語のテンプレートが使用されるため、結果が悪くなることがあります。
💡 使用アドバイス
仮説テンプレートを変更することで、分類結果を柔軟に調整できます。異なるテンプレートを試して、最適な結果を得ることができます。