PULI-GPT-3SX開源模型 - 免費部署，輕鬆實現匈牙利語文本生成

首頁

PULI GPT 3SX

由NYTK開發

PULI 3SX是一個擁有68.5億參數的匈牙利語GPT-NeoX模型，基於EleutherAI的GPT-NeoX架構訓練，適用於文本生成任務。

大型語言模型

Transformers

其他#匈牙利語生成 #大語言模型 #長文本生成

下載量 1,459

發布時間 : 12/19/2022

模型概述

這是一個針對匈牙利語優化的文本生成模型，基於GPT-NeoX架構，擁有68.5億參數，訓練數據達363億詞。

模型特點

大規模參數

擁有68.5億參數，能夠處理複雜的語言模式

匈牙利語優化

專門針對匈牙利語進行訓練和優化

長文本處理

支持最大2048個token的序列長度

模型能力

文本生成

語言建模

匈牙利語文本處理

使用案例

內容創作

故事創作

根據提示生成連貫的匈牙利語故事

生成符合上下文邏輯的連貫文本

文章續寫

根據開頭段落繼續生成文章內容

保持風格和主題一致性的續寫內容

語言技術研究

匈牙利語模型研究

用於研究匈牙利語的語言模型特性

為匈牙利語NLP研究提供基礎模型

🚀 PULI 3SX base (68.5億參數)

PULI 3SX base是一個匈牙利的GPT - NeoX模型，可用於文本生成任務。它擁有68.5億參數，在大量數據上進行訓練，能為匈牙利語相關的文本生成提供強大支持。

🚀 快速開始

若要進一步瞭解該模型的詳細信息，請訪問我們的演示網站。

✨ 主要特性

匈牙利GPT - NeoX模型（67億參數）。
使用EleutherAI的GPT - NeoX進行訓練，相關代碼可查看github。
數據集：包含363億個單詞。
檢查點：訓練至150000步。

🔧 技術細節

限制條件

最大序列長度（max_seq_length） = 2048

📚 詳細文檔

引用說明

如果您使用此模型，請引用以下論文：

@inproceedings {yang-puli,
    title = {Jönnek a nagyok! BERT-Large, GPT-2 és GPT-3 nyelvmodellek magyar nyelvre},
	booktitle = {XIX. Magyar Számítógépes Nyelvészeti Konferencia (MSZNY 2023)},
	year = {2023},
	publisher = {Szegedi Tudományegyetem, Informatikai Intézet},
	address = {Szeged, Hungary},
	author = {Yang, Zijian Győző and Dodé, Réka and Ferenczi, Gergő and Héja, Enikő and Jelencsik-Mátyus, Kinga and Kőrös, Ádám and Laki, László János and Ligeti-Nagy, Noémi and Vadász, Noémi and Váradi, Tamás},
	pages = {247--262}
}

💻 使用示例

基礎用法

from transformers import GPTNeoXForCausalLM, AutoTokenizer

model = GPTNeoXForCausalLM.from_pretrained("NYTK/PULI-GPT-3SX")
tokenizer = AutoTokenizer.from_pretrained("NYTK/PULI-GPT-3SX")
prompt = "Elmesélek egy történetet a nyelvtechnológiáról."
input_ids = tokenizer(prompt, return_tensors="pt").input_ids

gen_tokens = model.generate(
    input_ids,
    do_sample=True,
    temperature=0.9,
    max_length=100,
)

gen_text = tokenizer.batch_decode(gen_tokens)[0]
print(gen_text)

高級用法

from transformers import pipeline, GPTNeoXForCausalLM, AutoTokenizer

model = GPTNeoXForCausalLM.from_pretrained("NYTK/PULI-GPT-3SX")
tokenizer = AutoTokenizer.from_pretrained("NYTK/PULI-GPT-3SX")
prompt = "Elmesélek egy történetet a nyelvtechnológiáról."
generator = pipeline(task="text-generation", model=model, tokenizer=tokenizer)

print(generator(prompt)[0]["generated_text"])