German_Zeroshot オープンソースのドイツ語ゼロショット分類モデル - ドイツ語のテキスト分類タスクに無料で使用可能

German Zeroshot

Sahajtomarによって開発

GBERT Largeをベースとしたドイツ語ゼロショット分類モデルで、XNLIドイツ語データセットで微調整され、ドイツ語テキスト分類タスクに適しています。

テキスト分類複数言語対応#ドイツ語ゼロショット分類 #XNLI微調整 #GBERT大規模モデル

ダウンロード数 643

リリース時間 : 3/2/2022

モデル概要

このモデルはドイツ語ゼロショット分類モデルで、GBERT Largeアーキテクチャに基づいており、XNLIドイツ語データセットで微調整されています。主にドイツ語テキストのゼロショット分類タスクに使用され、特定のタスクでの訓練を行わずにテキストを分類することができます。

モデル特徴

ドイツ語専用

ドイツ語テキストに特化して最適化されたゼロショット分類モデル

高い正解率

XNLIドイツ語テストセットで83.6%の正解率を達成しました

仮説テンプレートに敏感

仮説テンプレートの言語に敏感であり、最適な結果を得るにはドイツ語のテンプレートを使用する必要があります

モデル能力

ドイツ語テキスト分類

ゼロショット学習

自然言語推論

使用事例

テキスト分析

ニュース分類

ドイツ語のニュース記事を自動分類する

記事の主題カテゴリを正確に識別できます

感情分析

ドイツ語テキストの感情傾向を分析する

コンテンツ審査

不適切なコンテンツの識別

ドイツ語コミュニティ内の不適切なコンテンツを識別する

🚀 ドイツ語ゼロショット

このモデルは、テキスト分類タスクに特化したもので、ドイツ語のテキストに対してゼロショット分類を行うことができます。XNLIデータセットを用いてファインチューニングされており、高い精度を発揮します。

🚀 クイックスタート

このモデルを使用するには、以下の手順に従ってください。まず、必要なライブラリをインポートし、パイプラインを初期化します。その後、分類したいテキストと候補ラベルを指定して、モデルを実行します。

from transformers import pipeline
classifier = pipeline("zero-shot-classification",
                      model="Sahajtomar/German_Zeroshot")
sequence = "Letzte Woche gab es einen Selbstmord in einer nahe gelegenen kolonie"
candidate_labels = ["Verbrechen","Tragödie","Stehlen"]
hypothesis_template = "In deisem geht es um {}."    ## 単言語モデルのため、仮説テンプレートに敏感です。これは実験可能です。

classifier(sequence, candidate_labels, hypothesis_template=hypothesis_template)
"""{'labels': ['Tragödie', 'Verbrechen', 'Stehlen'],
 'scores': [0.8328856854438782, 0.10494536352157593, 0.06316883927583696],
 'sequence': 'Letzte Woche gab es einen Selbstmord in einer nahe gelegenen Kolonie'}"""

✨ 主な機能

高精度な分類：XNLIデータセットでファインチューニングされており、ドイツ語のテキスト分類に高い精度を発揮します。
ゼロショット分類：事前に学習していないクラスに対しても分類が可能です。
仮説テンプレートの指定：仮説テンプレートを指定することで、分類結果を柔軟に調整できます。

📚 ドキュメント

モデルの説明

このモデルは、GBERT Large をベースモデルとして使用し、xnli deデータセットでファインチューニングされています。デフォルトの仮説テンプレートは英語で This text is {} です。このモデルを使用する際には、「In deisem geht es um {}」などに変更する必要があります。Hugging Face APIを介して推論を行うと、デフォルトで英語のテンプレートが使用されるため、結果が悪くなることがあります。このモデルは単言語モデルであり、多言語モデルではないため、仮説テンプレートを適切に変更する必要があります。

精度評価

XNLI DEV (ドイツ語)

精度: 85.5

XNLI TEST (ドイツ語)

精度: 83.6

ゼロショット分類パイプライン

以下は、ゼロショット分類パイプラインを使用したコード例です。

from transformers import pipeline
classifier = pipeline("zero-shot-classification",
                      model="Sahajtomar/German_Zeroshot")
sequence = "Letzte Woche gab es einen Selbstmord in einer nahe gelegenen kolonie"
candidate_labels = ["Verbrechen","Tragödie","Stehlen"]
hypothesis_template = "In deisem geht es um {}."    ## 単言語モデルのため、仮説テンプレートに敏感です。これは実験可能です。

classifier(sequence, candidate_labels, hypothesis_template=hypothesis_template)
"""{'labels': ['Tragödie', 'Verbrechen', 'Stehlen'],
 'scores': [0.8328856854438782, 0.10494536352157593, 0.06316883927583696],
 'sequence': 'Letzte Woche gab es einen Selbstmord in einer nahe gelegenen Kolonie'}"""