gpt2-finetuned-greek开源希腊语文本生成模型 - 免费生成高质量希腊语内容

首页

Gpt2 Finetuned Greek

由 lighteternal 开发

基于英语GPT-2模型微调的希腊语文本生成模型，由希腊军事学院和克里特技术大学联合开发

大型语言模型其他开源协议:Apache-2.0 #希腊语文本生成 #基于GPT2微调 #多源语料训练

下载量 178

发布时间 : 3/2/2022

模型简介

这是一个针对希腊语优化的文本生成模型，基于OpenAI GPT-2架构，通过逐步解冻层进行微调训练，适用于希腊语文本生成任务

模型特点

高效微调方法

采用逐步解冻层的微调方式，相比从头训练更高效，特别适合资源较少的语言

大规模训练数据

使用约23.4GB的希腊语语料库进行训练，包含多种来源的文本数据

预训练模型迁移

基于英语GPT-2模型进行微调，充分利用预训练模型的知识

模型能力

希腊语文本生成

语言模型续写

创意写作辅助

使用案例

文本生成

故事续写

根据给定的开头继续生成连贯的故事内容

可生成符合希腊语语法和语境的连贯文本

内容创作辅助

帮助作家或内容创作者生成创意文本

提供多样化的文本续写选择

🚀 希腊语（el）GPT2 模型

本项目由希腊陆军学院（SSE）和克里特技术大学（TUC）合作完成，推出了基于英语 GPT - 2 微调的希腊语文本生成模型。该模型利用约 23.4GB 的希腊语语料进行训练，在希腊语文本生成任务中具有良好表现。

🚀 快速开始

你可以使用以下代码示例快速体验该模型的文本生成能力：

from transformers import pipeline

model = "lighteternal/gpt2-finetuned-greek"

generator = pipeline(
    'text-generation',
    device=0,
    model=f'{model}',
    tokenizer=f'{model}')
    
text = "Μια φορά κι έναν καιρό"

print("\n".join([x.get("generated_text") for x in generator(
    text,
    max_length=len(text.split(" "))+15,
    do_sample=True,
    top_k=50,
    repetition_penalty = 1.2,
    add_special_tokens=False,
    num_return_sequences=5,
    temperature=0.95,
    top_p=0.95)]))

✨ 主要特性

高效微调：基于英语 GPT - 2 模型进行微调，采用逐步解冻层的方法，相比从头开始训练更高效、更可持续，尤其适用于资源有限的语言。
丰富语料：使用约 23.4GB 的希腊语语料进行训练，语料来源于 CC100、Wikimatrix、Tatoeba、Books、SETIMES 和 GlobalVoices 等，包含长序列文本。

💻 使用示例

基础用法

from transformers import pipeline

model = "lighteternal/gpt2-finetuned-greek"

generator = pipeline(
    'text-generation',
    device=0,
    model=f'{model}',
    tokenizer=f'{model}')
    
text = "Μια φορά κι έναν καιρό"

print("\n".join([x.get("generated_text") for x in generator(
    text,
    max_length=len(text.split(" "))+15,
    do_sample=True,
    top_k=50,
    repetition_penalty = 1.2,
    add_special_tokens=False,
    num_return_sequences=5,
    temperature=0.95,
    top_p=0.95)]))

📚 详细文档

模型描述

这是一个基于英语 GPT - 2 的文本生成（自回归）模型，借助 Huggingface transformers 和 fastai 库实现。通过逐步解冻层的方式进行微调，为资源有限的语言提供了一种高效且可持续的训练方案。该模型的实现参考了 Thomas Dehaene（ML6）创建荷兰语 GPT2 的工作：点击查看。