ptt5-v2-base开源模型 - 基于Google继续训练，助力葡萄牙语相关应用

首页

Ptt5 V2 Base

由 unicamp-dl 开发

ptt5-v2是针对葡萄牙语预训练的T5模型系列，基于Google原始检查点继续训练而成。

大型语言模型

Transformers

其他开源协议:Apache-2.0 #葡萄牙语文本生成 #T5架构优化 #多任务学习

下载量 1,197

发布时间 : 6/9/2024

模型简介

该模型是基于T5架构的葡萄牙语预训练模型，主要用于文本生成任务。

模型特点

葡萄牙语优化

专门针对葡萄牙语进行了持续预训练，优化了语言理解能力

基于T5架构

采用Google T5-base架构，具有良好的文本生成能力

多用途文本处理

可用于多种文本生成和转换任务

模型能力

葡萄牙语文本生成

文本转换

语言理解

使用案例

自然语言处理

葡萄牙语文本摘要

生成葡萄牙语文本的简洁摘要

问答系统

构建葡萄牙语问答系统

🚀 ptt5-v2-base

ptt5-v2模型是专门为葡萄牙语定制的预训练T5模型，它基于谷歌原始的检查点继续训练，模型大小从t5-small到t5-3B不等。这些检查点被用于训练葡萄牙语的MonoT5重排器，你可以在它们的HuggingFace集合中找到。如需了解更多关于预训练过程的信息，请参考我们的论文ptt5-v2: A Closer Look at Continued Pretraining of T5 Models for the Portuguese Language。

🚀 快速开始

模型信息

属性	详情
数据集	allenai/c4、legacy-datasets/mc4
语言	葡萄牙语（pt）
任务类型	文本到文本生成
基础模型	google-t5/t5-base
许可证	apache-2.0

模型介绍

ptt5-v2模型是专门为葡萄牙语定制的预训练T5模型，它在谷歌原始检查点的基础上继续训练，模型大小涵盖从t5-small到t5-3B。这些检查点用于训练葡萄牙语的MonoT5重排器，可在其HuggingFace集合中找到。关于预训练过程的更多信息，请参考我们的论文ptt5-v2: A Closer Look at Continued Pretraining of T5 Models for the Portuguese Language。

💻 使用示例

基础用法

from transformers import T5Tokenizer, T5ForConditionalGeneration

tokenizer = T5Tokenizer.from_pretrained("unicamp-dl/ptt5-v2-base")
model = T5ForConditionalGeneration.from_pretrained("unicamp-dl/ptt5-v2-base")

📄 许可证

本项目采用apache-2.0许可证。

📚 详细文档

引用信息

如果你使用了我们的模型，请按照以下格式进行引用：

@article{piau2024ptt5v2,
      title={ptt5-v2: A Closer Look at Continued Pretraining of T5 Models for the Portuguese Language}, 
      author={Marcos Piau and Roberto Lotufo and Rodrigo Nogueira},
      year={2024},
      eprint={2406.10806},
      archivePrefix={arXiv},
      primaryClass={id='cs.CL' full_name='Computation and Language' is_active=True alt_name='cmp-lg' in_archive='cs' is_general=False description='Covers natural language processing. Roughly includes material in ACM Subject Class I.2.7. Note that work on artificial languages (programming languages, logics, formal systems) that does not explicitly address natural-language issues broadly construed (natural-language processing, computational linguistics, speech, text retrieval, etc.) is not appropriate for this area.'}
}