Randeng-T5-Char-700M-Chinese開源模型 - 免費部署處理中文自然語言轉換任務

首頁

Randeng T5 Char 700M Chinese

由IDEA-CCNL開發

擅長處理自然語言轉換任務的中文T5-large模型，採用BertTokenizer及中文字符級詞表。

大型語言模型

Transformers

中文開源協議:Apache-2.0 #中文文本重建 #字符級生成 #大規模預訓練

下載量 75

發布時間 : 10/22/2022

模型概述

基於T5-large架構進行中文優化的自然語言轉換模型，適用於多種文本生成和轉換任務。

模型特點

中文優化

採用BertTokenizer及支持中英文的混合詞表，專門針對中文文本處理進行優化。

大規模預訓練

使用語料庫自適應預訓練技術(CAPT)在180G悟道語料庫上繼續訓練，提升模型性能。

文本重建能力

預訓練目標為span corruption文本重建，擅長處理文本生成和轉換任務。

模型能力

文本生成

自然語言轉換

文本重建

使用案例

文本生成

句子補全

根據給定的部分句子生成完整的句子內容。

示例輸入：'北京有悠久的 <extra_id_0>和 <extra_id_1>。'

自然語言處理

文本轉換

將一種形式的文本轉換為另一種形式。

🚀 Randeng-T5-Char-700M-Chinese

Randeng-T5-Char-700M-Chinese是中文版的T5-large，善於處理NLT任務。它採用了BertTokenizer和中文字級別詞典，能更好地適用於中文自然語言處理任務。

🚀 快速開始

環境準備

你可以按照以下代碼示例來使用Randeng-T5-Char-700M-Chinese模型：

from transformers import T5ForConditionalGeneration, BertTokenizer
import torch

tokenizer=BertTokenizer.from_pretrained('IDEA-CCNL/Randeng-T5-Char-700M-Chinese', add_special_tokens=False)
model=T5ForConditionalGeneration.from_pretrained('IDEA-CCNL/Randeng-T5-Char-700M-Chinese')

✨ 主要特性

專門為中文任務設計，採用BertTokenizer和中文字級別詞典。
運用語料庫自適應預訓練(Corpus-Adaptive Pre-Training, CAPT)技術在悟道語料庫(180G版本)繼續預訓練，提升模型性能。

📦 模型信息

模型分類

屬性	詳情
需求	通用
任務	自然語言轉換 NLT
系列	燃燈 Randeng
模型	T5
參數	700M
額外	中文-Chinese

模型訓練

對比T5-small，我們訓練了它的中文版。為了更好適用於中文任務，我們僅使用BertTokenzier，和支持中英文的詞表，並且使用了語料庫自適應預訓練(Corpus-Adaptive Pre-Training, CAPT)技術在悟道語料庫(180G版本)繼續預訓練。預訓練目標為破壞span。具體地，我們在預訓練階段中使用了封神框架大概花費了16張A100約96小時。

📄 許可證

本項目採用Apache-2.0許可證。

📚 引用

引用論文

如果您在您的工作中使用了我們的模型，可以引用我們的論文：

@article{fengshenbang,
  author    = {Jiaxing Zhang and Ruyi Gan and Junjie Wang and Yuxiang Zhang and Lin Zhang and Ping Yang and Xinyu Gao and Ziwei Wu and Xiaoqun Dong and Junqing He and Jianheng Zhuo and Qi Yang and Yongfeng Huang and Xiayu Li and Yanghan Wu and Junyu Lu and Xinyu Zhu and Weifeng Chen and Ting Han and Kunhao Pan and Rui Wang and Hao Wang and Xiaojun Wu and Zhongshen Zeng and Chongpei Chen},
  title     = {Fengshenbang 1.0: Being the Foundation of Chinese Cognitive Intelligence},
  journal   = {CoRR},
  volume    = {abs/2209.02970},
  year      = {2022}
}

引用網站

也可以引用我們的網站:

@misc{Fengshenbang-LM,
  title={Fengshenbang-LM},
  author={IDEA-CCNL},
  year={2021},
  howpublished={\url{https://github.com/IDEA-CCNL/Fengshenbang-LM}},
}