gpt2-model-de开源德语语言模型 - 免费使用助力德语文本生成任务

首页

Gpt2 Model De

由 Tanhim 开发

这是一个基于GPT-2架构的德语语言模型，专门针对德语文本生成任务进行了训练。

大型语言模型

Transformers

德语#德语文本生成 #新闻内容创作 #Transformer架构

下载量 18

发布时间 : 3/2/2022

模型简介

该模型基于GPT-2架构，使用万篇德语新闻文章数据集训练，适用于德语文本生成任务。

模型特点

德语优化

专门针对德语语言特性进行训练和优化

文本生成

能够生成连贯、流畅的德语文本

开源许可

采用GPL许可证，允许自由使用和修改

模型能力

德语文本生成

语言模型推理

文本自动补全

使用案例

内容创作

新闻写作辅助

帮助记者或内容创作者生成新闻草稿

创意写作

生成故事、诗歌等创意文本

教育

语言学习

为德语学习者提供语言练习材料

🚀 德语GPT2模型

本项目提供了一个用于德语的GPT2模型，可用于文本生成等自然语言处理任务，基于特定的德语新闻文章数据集训练，能为德语相关的研究和应用提供有力支持。

🚀 快速开始

你可以直接使用此模型结合文本生成管道进行操作。由于生成过程存在一定随机性，为保证结果可复现，这里设置了随机种子：

>>> from transformers import pipeline, set_seed
>>> generation= pipeline('text-generation', model='Tanhim/gpt2-model-de', tokenizer='Tanhim/gpt2-model-de')
>>> set_seed(42)
>>> generation("Hallo, ich bin ein Sprachmodell,", max_length=30, num_return_sequences=5)

以下是在PyTorch中使用该模型获取给定文本特征的方法：

from transformers import AutoTokenizer, AutoModelWithLMHead 
tokenizer = AutoTokenizer.from_pretrained("Tanhim/gpt2-model-de") 
model = AutoModelWithLMHead.from_pretrained("Tanhim/gpt2-model-de") 
text = "Ersetzen Sie mich durch einen beliebigen Text, den Sie w√ºnschen."
encoded_input = tokenizer(text, return_tensors='pt')
output = model(**encoded_input)

💻 使用示例

基础用法

>>> from transformers import pipeline, set_seed
>>> generation= pipeline('text-generation', model='Tanhim/gpt2-model-de', tokenizer='Tanhim/gpt2-model-de')
>>> set_seed(42)
>>> generation("Hallo, ich bin ein Sprachmodell,", max_length=30, num_return_sequences=5)

高级用法

from transformers import AutoTokenizer, AutoModelWithLMHead 
tokenizer = AutoTokenizer.from_pretrained("Tanhim/gpt2-model-de") 
model = AutoModelWithLMHead.from_pretrained("Tanhim/gpt2-model-de") 
text = "Ersetzen Sie mich durch einen beliebigen Text, den Sie w√ºnschen."
encoded_input = tokenizer(text, return_tensors='pt')
output = model(**encoded_input)

📚 详细文档

模型信息

属性	详情
模型名称	Tanhim/gpt2-model-de
语言	德语
缩略图链接	https://huggingface.co/Tanhim/gpt2-model-de
训练数据集	一万篇德语新闻文章数据集

引用要求

如果您在研究中使用了本仓库的模型，请考虑按以下方式引用：

@misc{GermanTransformer,
  author = {Tanhim Islam},
  title = {{PyTorch Based Transformer Machine Learning Model for German Text Generation Task}},
  howpublished = "\url{https://huggingface.co/Tanhim/gpt2-model-de}",
  year = {2021}, 
  note = "[Online; accessed 17-June-2021]"
}