gpt2-model-de開源德語語言模型 - 免費使用助力德語文本生成任務

首頁

Gpt2 Model De

由Tanhim開發

這是一個基於GPT-2架構的德語語言模型，專門針對德語文本生成任務進行了訓練。

大型語言模型

Transformers

德語#德語文本生成 #新聞內容創作 #Transformer架構

下載量 18

發布時間 : 3/2/2022

模型概述

該模型基於GPT-2架構，使用萬篇德語新聞文章數據集訓練，適用於德語文本生成任務。

模型特點

德語優化

專門針對德語語言特性進行訓練和優化

文本生成

能夠生成連貫、流暢的德語文本

開源許可

採用GPL許可證，允許自由使用和修改

模型能力

德語文本生成

語言模型推理

文本自動補全

使用案例

內容創作

新聞寫作輔助

幫助記者或內容創作者生成新聞草稿

創意寫作

生成故事、詩歌等創意文本

教育

語言學習

為德語學習者提供語言練習材料

🚀 德語GPT2模型

本項目提供了一個用於德語的GPT2模型，可用於文本生成等自然語言處理任務，基於特定的德語新聞文章數據集訓練，能為德語相關的研究和應用提供有力支持。

🚀 快速開始

你可以直接使用此模型結合文本生成管道進行操作。由於生成過程存在一定隨機性，為保證結果可復現，這裡設置了隨機種子：

>>> from transformers import pipeline, set_seed
>>> generation= pipeline('text-generation', model='Tanhim/gpt2-model-de', tokenizer='Tanhim/gpt2-model-de')
>>> set_seed(42)
>>> generation("Hallo, ich bin ein Sprachmodell,", max_length=30, num_return_sequences=5)

以下是在PyTorch中使用該模型獲取給定文本特徵的方法：

from transformers import AutoTokenizer, AutoModelWithLMHead 
tokenizer = AutoTokenizer.from_pretrained("Tanhim/gpt2-model-de") 
model = AutoModelWithLMHead.from_pretrained("Tanhim/gpt2-model-de") 
text = "Ersetzen Sie mich durch einen beliebigen Text, den Sie w√ºnschen."
encoded_input = tokenizer(text, return_tensors='pt')
output = model(**encoded_input)

💻 使用示例

基礎用法

>>> from transformers import pipeline, set_seed
>>> generation= pipeline('text-generation', model='Tanhim/gpt2-model-de', tokenizer='Tanhim/gpt2-model-de')
>>> set_seed(42)
>>> generation("Hallo, ich bin ein Sprachmodell,", max_length=30, num_return_sequences=5)

高級用法

from transformers import AutoTokenizer, AutoModelWithLMHead 
tokenizer = AutoTokenizer.from_pretrained("Tanhim/gpt2-model-de") 
model = AutoModelWithLMHead.from_pretrained("Tanhim/gpt2-model-de") 
text = "Ersetzen Sie mich durch einen beliebigen Text, den Sie w√ºnschen."
encoded_input = tokenizer(text, return_tensors='pt')
output = model(**encoded_input)

📚 詳細文檔

模型信息

屬性	詳情
模型名稱	Tanhim/gpt2-model-de
語言	德語
縮略圖鏈接	https://huggingface.co/Tanhim/gpt2-model-de
訓練數據集	一萬篇德語新聞文章數據集

引用要求

如果您在研究中使用了本倉庫的模型，請考慮按以下方式引用：

@misc{GermanTransformer,
  author = {Tanhim Islam},
  title = {{PyTorch Based Transformer Machine Learning Model for German Text Generation Task}},
  howpublished = "\url{https://huggingface.co/Tanhim/gpt2-model-de}",
  year = {2021}, 
  note = "[Online; accessed 17-June-2021]"
}