PULI-GPT-3SX开源模型 - 免费部署，轻松实现匈牙利语文本生成

首页

PULI GPT 3SX

由 NYTK 开发

PULI 3SX是一个拥有68.5亿参数的匈牙利语GPT-NeoX模型，基于EleutherAI的GPT-NeoX架构训练，适用于文本生成任务。

大型语言模型

Transformers

其他#匈牙利语生成 #大语言模型 #长文本生成

下载量 1,459

发布时间 : 12/19/2022

模型简介

这是一个针对匈牙利语优化的文本生成模型，基于GPT-NeoX架构，拥有68.5亿参数，训练数据达363亿词。

模型特点

大规模参数

拥有68.5亿参数，能够处理复杂的语言模式

匈牙利语优化

专门针对匈牙利语进行训练和优化

长文本处理

支持最大2048个token的序列长度

模型能力

文本生成

语言建模

匈牙利语文本处理

使用案例

内容创作

故事创作

根据提示生成连贯的匈牙利语故事

生成符合上下文逻辑的连贯文本

文章续写

根据开头段落继续生成文章内容

保持风格和主题一致性的续写内容

语言技术研究

匈牙利语模型研究

用于研究匈牙利语的语言模型特性

为匈牙利语NLP研究提供基础模型

🚀 PULI 3SX base (68.5亿参数)

PULI 3SX base是一个匈牙利的GPT - NeoX模型，可用于文本生成任务。它拥有68.5亿参数，在大量数据上进行训练，能为匈牙利语相关的文本生成提供强大支持。

🚀 快速开始

若要进一步了解该模型的详细信息，请访问我们的演示网站。

✨ 主要特性

匈牙利GPT - NeoX模型（67亿参数）。
使用EleutherAI的GPT - NeoX进行训练，相关代码可查看github。
数据集：包含363亿个单词。
检查点：训练至150000步。

🔧 技术细节

限制条件

最大序列长度（max_seq_length） = 2048

📚 详细文档

引用说明

如果您使用此模型，请引用以下论文：

@inproceedings {yang-puli,
    title = {Jönnek a nagyok! BERT-Large, GPT-2 és GPT-3 nyelvmodellek magyar nyelvre},
	booktitle = {XIX. Magyar Számítógépes Nyelvészeti Konferencia (MSZNY 2023)},
	year = {2023},
	publisher = {Szegedi Tudományegyetem, Informatikai Intézet},
	address = {Szeged, Hungary},
	author = {Yang, Zijian Győző and Dodé, Réka and Ferenczi, Gergő and Héja, Enikő and Jelencsik-Mátyus, Kinga and Kőrös, Ádám and Laki, László János and Ligeti-Nagy, Noémi and Vadász, Noémi and Váradi, Tamás},
	pages = {247--262}
}

💻 使用示例

基础用法

from transformers import GPTNeoXForCausalLM, AutoTokenizer

model = GPTNeoXForCausalLM.from_pretrained("NYTK/PULI-GPT-3SX")
tokenizer = AutoTokenizer.from_pretrained("NYTK/PULI-GPT-3SX")
prompt = "Elmesélek egy történetet a nyelvtechnológiáról."
input_ids = tokenizer(prompt, return_tensors="pt").input_ids

gen_tokens = model.generate(
    input_ids,
    do_sample=True,
    temperature=0.9,
    max_length=100,
)

gen_text = tokenizer.batch_decode(gen_tokens)[0]
print(gen_text)

高级用法

from transformers import pipeline, GPTNeoXForCausalLM, AutoTokenizer

model = GPTNeoXForCausalLM.from_pretrained("NYTK/PULI-GPT-3SX")
tokenizer = AutoTokenizer.from_pretrained("NYTK/PULI-GPT-3SX")
prompt = "Elmesélek egy történetet a nyelvtechnológiáról."
generator = pipeline(task="text-generation", model=model, tokenizer=tokenizer)

print(generator(prompt)[0]["generated_text"])