gpt2-finetuned-greek開源希臘語文本生成模型 - 免費生成高質量希臘語內容

首頁

Gpt2 Finetuned Greek

由lighteternal開發

基於英語GPT-2模型微調的希臘語文本生成模型，由希臘軍事學院和克里特技術大學聯合開發

大型語言模型其他開源協議:Apache-2.0 #希臘語文本生成 #基於GPT2微調 #多源語料訓練

下載量 178

發布時間 : 3/2/2022

模型概述

這是一個針對希臘語優化的文本生成模型，基於OpenAI GPT-2架構，通過逐步解凍層進行微調訓練，適用於希臘語文本生成任務

模型特點

高效微調方法

採用逐步解凍層的微調方式，相比從頭訓練更高效，特別適合資源較少的語言

大規模訓練數據

使用約23.4GB的希臘語語料庫進行訓練，包含多種來源的文本數據

預訓練模型遷移

基於英語GPT-2模型進行微調，充分利用預訓練模型的知識

模型能力

希臘語文本生成

語言模型續寫

創意寫作輔助

使用案例

文本生成

故事續寫

根據給定的開頭繼續生成連貫的故事內容

可生成符合希臘語語法和語境的連貫文本

內容創作輔助

幫助作家或內容創作者生成創意文本

提供多樣化的文本續寫選擇

🚀 希臘語（el）GPT2 模型

本項目由希臘陸軍學院（SSE）和克里特技術大學（TUC）合作完成，推出了基於英語 GPT - 2 微調的希臘語文本生成模型。該模型利用約 23.4GB 的希臘語語料進行訓練，在希臘語文本生成任務中具有良好表現。

🚀 快速開始

你可以使用以下代碼示例快速體驗該模型的文本生成能力：

from transformers import pipeline

model = "lighteternal/gpt2-finetuned-greek"

generator = pipeline(
    'text-generation',
    device=0,
    model=f'{model}',
    tokenizer=f'{model}')
    
text = "Μια φορά κι έναν καιρό"

print("\n".join([x.get("generated_text") for x in generator(
    text,
    max_length=len(text.split(" "))+15,
    do_sample=True,
    top_k=50,
    repetition_penalty = 1.2,
    add_special_tokens=False,
    num_return_sequences=5,
    temperature=0.95,
    top_p=0.95)]))

✨ 主要特性

高效微調：基於英語 GPT - 2 模型進行微調，採用逐步解凍層的方法，相比從頭開始訓練更高效、更可持續，尤其適用於資源有限的語言。
豐富語料：使用約 23.4GB 的希臘語語料進行訓練，語料來源於 CC100、Wikimatrix、Tatoeba、Books、SETIMES 和 GlobalVoices 等，包含長序列文本。

💻 使用示例

基礎用法

from transformers import pipeline

model = "lighteternal/gpt2-finetuned-greek"

generator = pipeline(
    'text-generation',
    device=0,
    model=f'{model}',
    tokenizer=f'{model}')
    
text = "Μια φορά κι έναν καιρό"

print("\n".join([x.get("generated_text") for x in generator(
    text,
    max_length=len(text.split(" "))+15,
    do_sample=True,
    top_k=50,
    repetition_penalty = 1.2,
    add_special_tokens=False,
    num_return_sequences=5,
    temperature=0.95,
    top_p=0.95)]))

📚 詳細文檔

模型描述

這是一個基於英語 GPT - 2 的文本生成（自迴歸）模型，藉助 Huggingface transformers 和 fastai 庫實現。通過逐步解凍層的方式進行微調，為資源有限的語言提供了一種高效且可持續的訓練方案。該模型的實現參考了 Thomas Dehaene（ML6）創建荷蘭語 GPT2 的工作：點擊查看。