R

Randeng T5 Char 700M Chinese

由IDEA-CCNL開發
擅長處理自然語言轉換任務的中文T5-large模型,採用BertTokenizer及中文字符級詞表。
下載量 75
發布時間 : 10/22/2022

模型概述

基於T5-large架構進行中文優化的自然語言轉換模型,適用於多種文本生成和轉換任務。

模型特點

中文優化
採用BertTokenizer及支持中英文的混合詞表,專門針對中文文本處理進行優化。
大規模預訓練
使用語料庫自適應預訓練技術(CAPT)在180G悟道語料庫上繼續訓練,提升模型性能。
文本重建能力
預訓練目標為span corruption文本重建,擅長處理文本生成和轉換任務。

模型能力

文本生成
自然語言轉換
文本重建

使用案例

文本生成
句子補全
根據給定的部分句子生成完整的句子內容。
示例輸入:'北京有悠久的 <extra_id_0>和 <extra_id_1>。'
自然語言處理
文本轉換
將一種形式的文本轉換為另一種形式。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase