R

Randeng T5 Char 700M Chinese

由 IDEA-CCNL 开发
擅长处理自然语言转换任务的中文T5-large模型,采用BertTokenizer及中文字符级词表。
下载量 75
发布时间 : 10/22/2022

模型简介

基于T5-large架构进行中文优化的自然语言转换模型,适用于多种文本生成和转换任务。

模型特点

中文优化
采用BertTokenizer及支持中英文的混合词表,专门针对中文文本处理进行优化。
大规模预训练
使用语料库自适应预训练技术(CAPT)在180G悟道语料库上继续训练,提升模型性能。
文本重建能力
预训练目标为span corruption文本重建,擅长处理文本生成和转换任务。

模型能力

文本生成
自然语言转换
文本重建

使用案例

文本生成
句子补全
根据给定的部分句子生成完整的句子内容。
示例输入:'北京有悠久的 <extra_id_0>和 <extra_id_1>。'
自然语言处理
文本转换
将一种形式的文本转换为另一种形式。
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase