Randeng-T5-Char-700M-Chinese开源模型 - 免费部署处理中文自然语言转换任务

首页

Randeng T5 Char 700M Chinese

由 IDEA-CCNL 开发

擅长处理自然语言转换任务的中文T5-large模型，采用BertTokenizer及中文字符级词表。

大型语言模型

Transformers

中文开源协议:Apache-2.0 #中文文本重建 #字符级生成 #大规模预训练

下载量 75

发布时间 : 10/22/2022

模型简介

基于T5-large架构进行中文优化的自然语言转换模型，适用于多种文本生成和转换任务。

模型特点

中文优化

采用BertTokenizer及支持中英文的混合词表，专门针对中文文本处理进行优化。

大规模预训练

使用语料库自适应预训练技术(CAPT)在180G悟道语料库上继续训练，提升模型性能。

文本重建能力

预训练目标为span corruption文本重建，擅长处理文本生成和转换任务。

模型能力

文本生成

自然语言转换

文本重建

使用案例

文本生成

句子补全

根据给定的部分句子生成完整的句子内容。

示例输入：'北京有悠久的 <extra_id_0>和 <extra_id_1>。'

自然语言处理

文本转换

将一种形式的文本转换为另一种形式。

🚀 Randeng-T5-Char-700M-Chinese

Randeng-T5-Char-700M-Chinese是中文版的T5-large，善于处理NLT任务。它采用了BertTokenizer和中文字级别词典，能更好地适用于中文自然语言处理任务。

🚀 快速开始

环境准备

你可以按照以下代码示例来使用Randeng-T5-Char-700M-Chinese模型：

from transformers import T5ForConditionalGeneration, BertTokenizer
import torch

tokenizer=BertTokenizer.from_pretrained('IDEA-CCNL/Randeng-T5-Char-700M-Chinese', add_special_tokens=False)
model=T5ForConditionalGeneration.from_pretrained('IDEA-CCNL/Randeng-T5-Char-700M-Chinese')

✨ 主要特性

专门为中文任务设计，采用BertTokenizer和中文字级别词典。
运用语料库自适应预训练(Corpus-Adaptive Pre-Training, CAPT)技术在悟道语料库(180G版本)继续预训练，提升模型性能。

📦 模型信息

模型分类

属性	详情
需求	通用
任务	自然语言转换 NLT
系列	燃灯 Randeng
模型	T5
参数	700M
额外	中文-Chinese

模型训练

对比T5-small，我们训练了它的中文版。为了更好适用于中文任务，我们仅使用BertTokenzier，和支持中英文的词表，并且使用了语料库自适应预训练(Corpus-Adaptive Pre-Training, CAPT)技术在悟道语料库(180G版本)继续预训练。预训练目标为破坏span。具体地，我们在预训练阶段中使用了封神框架大概花费了16张A100约96小时。

📄 许可证

本项目采用Apache-2.0许可证。

📚 引用

引用论文

如果您在您的工作中使用了我们的模型，可以引用我们的论文：

@article{fengshenbang,
  author    = {Jiaxing Zhang and Ruyi Gan and Junjie Wang and Yuxiang Zhang and Lin Zhang and Ping Yang and Xinyu Gao and Ziwei Wu and Xiaoqun Dong and Junqing He and Jianheng Zhuo and Qi Yang and Yongfeng Huang and Xiayu Li and Yanghan Wu and Junyu Lu and Xinyu Zhu and Weifeng Chen and Ting Han and Kunhao Pan and Rui Wang and Hao Wang and Xiaojun Wu and Zhongshen Zeng and Chongpei Chen},
  title     = {Fengshenbang 1.0: Being the Foundation of Chinese Cognitive Intelligence},
  journal   = {CoRR},
  volume    = {abs/2209.02970},
  year      = {2022}
}

引用网站

也可以引用我们的网站:

@misc{Fengshenbang-LM,
  title={Fengshenbang-LM},
  author={IDEA-CCNL},
  year={2021},
  howpublished={\url{https://github.com/IDEA-CCNL/Fengshenbang-LM}},
}