gpt2-124M-uk-fiction開源語言模型 - 免費生成高質量烏克蘭語文本

首頁

Gpt2 124M Uk Fiction

由Tereveni-AI開發

基於烏克蘭小說訓練的GPT-2語言模型，參數規模124M，專門用於烏克蘭語文本生成

大型語言模型其他#烏克蘭文學生成 #小說續寫 #多風格文本生成

下載量 60

發布時間 : 3/2/2022

模型概述

該模型是在4040本烏克蘭小說組成的語料庫上訓練的GPT-2語言模型，適用於烏克蘭語文本生成任務

模型特點

烏克蘭語優化

專門針對烏克蘭文學作品進行訓練，生成文本風格符合烏克蘭文學特點

多樣化生成

支持生成多樣化的文本輸出，每次生成結果可能不同

中等規模

124M參數的模型規模，在生成質量和計算資源需求間取得平衡

模型能力

烏克蘭語文本生成

文學作品風格模仿

創意寫作輔助

使用案例

文學創作

小說續寫

根據給定的烏克蘭語小說片段自動生成後續內容

生成符合原文風格的連貫文本

創意寫作

為作家提供寫作靈感和素材

生成多種可能的文本變體供選擇

教育

烏克蘭語學習

生成烏克蘭語學習材料

提供地道的烏克蘭語表達示例

🚀 GPT2 124M烏克蘭小說訓練模型

本模型基於GPT2 124M在烏克蘭小說數據集上進行訓練，可用於文本生成任務，為烏克蘭語相關的文本創作提供支持。

🚀 快速開始

由於我們使用 AlbertTokenizer 和 GPT2LMHeadModel，上述默認代碼片段將無法正常工作，請參考問題。

✨ 主要特性

文本生成：能夠根據給定的輸入文本生成相關的烏克蘭語文本。

📦 安裝指南

文檔未提供具體安裝步驟，故跳過該章節。

💻 使用示例

基礎用法

from transformers import AlbertTokenizer, GPT2LMHeadModel

tokenizer = AlbertTokenizer.from_pretrained("Tereveni-AI/gpt2-124M-uk-fiction")
model = GPT2LMHeadModel.from_pretrained("Tereveni-AI/gpt2-124M-uk-fiction")

input_ids = tokenizer.encode("Но зла Юнона, суча дочка,", add_special_tokens=False, return_tensors='pt')

outputs = model.generate(
    input_ids,
    do_sample=True,
    num_return_sequences=3,
    max_length=50
)

for i, out in enumerate(outputs):
    print("{}: {}".format(i, tokenizer.decode(out)))

運行上述代碼可能會輸出如下內容：

0: Но зла Юнона, суча дочка, яка затьмарила всі її таємниці: І хто з'їсть її душу, той помре». І, не дочекавшись гніву богів, посунула в пітьму, щоб не бачити перед собою. Але, за
1: Но зла Юнона, суча дочка, і довела мене до божевілля. Але він не знав нічого. Після того як я його побачив, мені стало зле. Я втратив рівновагу. Але в мене не було часу на роздуми. Я вже втратив надію
2: Но зла Юнона, суча дочка, не нарікала нам! — раптом вигукнула Юнона. — Це ти, старий йолопе! — мовила вона, не перестаючи сміятись. — Хіба ти не знаєш, що мені подобається ходити з тобою?