🚀 Randeng-T5-Char-700M-Chinese
Randeng-T5-Char-700M-Chinese是中文版的T5-large,善於處理NLT任務。它採用了BertTokenizer和中文字級別詞典,能更好地適用於中文自然語言處理任務。
🚀 快速開始
環境準備
你可以按照以下代碼示例來使用Randeng-T5-Char-700M-Chinese模型:
from transformers import T5ForConditionalGeneration, BertTokenizer
import torch
tokenizer=BertTokenizer.from_pretrained('IDEA-CCNL/Randeng-T5-Char-700M-Chinese', add_special_tokens=False)
model=T5ForConditionalGeneration.from_pretrained('IDEA-CCNL/Randeng-T5-Char-700M-Chinese')
✨ 主要特性
- 專門為中文任務設計,採用BertTokenizer和中文字級別詞典。
- 運用語料庫自適應預訓練(Corpus-Adaptive Pre-Training, CAPT)技術在悟道語料庫(180G版本)繼續預訓練,提升模型性能。
📦 模型信息
模型分類
屬性 |
詳情 |
需求 |
通用 |
任務 |
自然語言轉換 NLT |
系列 |
燃燈 Randeng |
模型 |
T5 |
參數 |
700M |
額外 |
中文-Chinese |
模型訓練
對比T5-small,我們訓練了它的中文版。為了更好適用於中文任務,我們僅使用BertTokenzier,和支持中英文的詞表,並且使用了語料庫自適應預訓練(Corpus-Adaptive Pre-Training, CAPT)技術在悟道語料庫(180G版本)繼續預訓練。預訓練目標為破壞span。具體地,我們在預訓練階段中使用了封神框架大概花費了16張A100約96小時。
📄 許可證
本項目採用Apache-2.0許可證。
📚 引用
引用論文
如果您在您的工作中使用了我們的模型,可以引用我們的論文:
@article{fengshenbang,
author = {Jiaxing Zhang and Ruyi Gan and Junjie Wang and Yuxiang Zhang and Lin Zhang and Ping Yang and Xinyu Gao and Ziwei Wu and Xiaoqun Dong and Junqing He and Jianheng Zhuo and Qi Yang and Yongfeng Huang and Xiayu Li and Yanghan Wu and Junyu Lu and Xinyu Zhu and Weifeng Chen and Ting Han and Kunhao Pan and Rui Wang and Hao Wang and Xiaojun Wu and Zhongshen Zeng and Chongpei Chen},
title = {Fengshenbang 1.0: Being the Foundation of Chinese Cognitive Intelligence},
journal = {CoRR},
volume = {abs/2209.02970},
year = {2022}
}
引用網站
也可以引用我們的網站:
@misc{Fengshenbang-LM,
title={Fengshenbang-LM},
author={IDEA-CCNL},
year={2021},
howpublished={\url{https://github.com/IDEA-CCNL/Fengshenbang-LM}},
}
相關鏈接