gpt2-model-deオープンソースドイツ語言語モデル - 無料で利用してドイツ語テキスト生成タスクを支援

ホーム

Gpt2 Model De

Tanhimによって開発

これはGPT-2アーキテクチャに基づくドイツ語言語モデルで、ドイツ語テキスト生成タスク向けに特別に訓練されています。

大規模言語モデル

Transformers

ドイツ語#ドイツ語テキスト生成 #ニュースコンテンツ作成 #Transformerアーキテクチャ

ダウンロード数 18

リリース時間 : 3/2/2022

モデル概要

このモデルはGPT-2アーキテクチャに基づき、数万件のドイツ語ニュース記事データセットで訓練されており、ドイツ語テキスト生成タスクに適しています。

モデル特徴

ドイツ語最適化

ドイツ語の言語特性に特化して訓練・最適化されています

テキスト生成

一貫性があり流暢なドイツ語テキストを生成可能

オープンソースライセンス

GPLライセンスを採用しており、自由な使用と改変が許可されています

モデル能力

ドイツ語テキスト生成

言語モデル推論

テキスト自動補完

使用事例

コンテンツ作成

ニュース執筆支援

記者やコンテンツクリエイターがニュースの下書きを生成するのを支援

クリエイティブライティング

物語や詩などの創造的なテキストを生成

教育

言語学習

ドイツ語学習者向けに言語練習教材を提供

🚀 ドイツ語用GPT2モデル

このモデルはドイツ語のテキスト生成に特化したGPT2ベースのモデルです。Ten Thousand German News Articles Datasetを使って訓練されており、高品質なドイツ語テキストを生成できます。

🚀 クイックスタート

このモデルはテキスト生成パイプラインで直接使用できます。生成にはランダム性が含まれるため、再現性のためにシードを設定します。

>>> from transformers import pipeline, set_seed
>>> generation= pipeline('text-generation', model='Tanhim/gpt2-model-de', tokenizer='Tanhim/gpt2-model-de')
>>> set_seed(42)
>>> generation("Hallo, ich bin ein Sprachmodell,", max_length=30, num_return_sequences=5)

以下は、このモデルを使用してPyTorchで与えられたテキストの特徴を取得する方法です。

from transformers import AutoTokenizer, AutoModelWithLMHead 
tokenizer = AutoTokenizer.from_pretrained("Tanhim/gpt2-model-de") 
model = AutoModelWithLMHead.from_pretrained("Tanhim/gpt2-model-de") 
text = "Ersetzen Sie mich durch einen beliebigen Text, den Sie w√ºnschen."
encoded_input = tokenizer(text, return_tensors='pt')
output = model(**encoded_input)

💻 使用例

基本的な使用法

>>> from transformers import pipeline, set_seed
>>> generation= pipeline('text-generation', model='Tanhim/gpt2-model-de', tokenizer='Tanhim/gpt2-model-de')
>>> set_seed(42)
>>> generation("Hallo, ich bin ein Sprachmodell,", max_length=30, num_return_sequences=5)

高度な使用法

from transformers import AutoTokenizer, AutoModelWithLMHead 
tokenizer = AutoTokenizer.from_pretrained("Tanhim/gpt2-model-de") 
model = AutoModelWithLMHead.from_pretrained("Tanhim/gpt2-model-de") 
text = "Ersetzen Sie mich durch einen beliebigen Text, den Sie w√ºnschen."
encoded_input = tokenizer(text, return_tensors='pt')
output = model(**encoded_input)

📚 ドキュメント

モデル情報

属性	详情
モデル名	Tanhim/gpt2-model-de
言語	ドイツ語
サムネイル	https://huggingface.co/Tanhim/gpt2-model-de
訓練データセット	Ten Thousand German News Articles Dataset

引用

もしあなたの研究でこのリポジトリのモデルを使用する場合は、以下のように引用を考慮してください。

@misc{GermanTransformer,
  author = {Tanhim Islam},
  title = {{PyTorch Based Transformer Machine Learning Model for German Text Generation Task}},
  howpublished = "\url{https://huggingface.co/Tanhim/gpt2-model-de}",
  year = {2021}, 
  note = "[Online; accessed 17-June-2021]"
}