G

Gpt2 Spanish Medium

由 DeepESP 开发
GPT2-西班牙语版是一个从头开始训练的语言生成模型,使用了11.5GB的西班牙语文本,并为此专门训练了一个字节对编码(BPE)分词器。
下载量 221
发布时间 : 3/2/2022

模型简介

该模型是一个基于西班牙语文本训练的GPT-2中等规模版本,主要用于西班牙语文本生成任务。

模型特点

专门训练的西班牙语分词器
分词器完全基于西班牙语语料训练,避免了使用英语分词器带来的语义捕捉限制。
丰富的训练语料
使用了11.5GB西班牙语文本,包括3.5GB维基百科和8GB各类书籍。
新增特殊标记
除标准结束标记外,还新增了'<|talk|>'等标记,便于后续训练使用。

模型能力

西班牙语文本生成
长文本生成(支持1024个token的上下文)

使用案例

内容创作
小说续写
根据给定的西班牙语小说开头,生成后续情节。
诗歌创作
生成西班牙语诗歌。
教育
语言学习辅助
生成西班牙语学习材料或练习文本。
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase