C

CPM Generate

由TsinghuaAI開發
CPM是基於Transformer的26億參數中文預訓練語言模型,使用100GB中文語料訓練,支持多種自然語言處理任務。
下載量 622
發布時間 : 3/2/2022

模型概述

大規模生成式中文預訓練語言模型,適用於文本生成、對話系統、完形填空等下游任務。

模型特點

大規模中文預訓練
使用100GB多樣化中文語料訓練,涵蓋百科、網頁、新聞等多領域數據
少樣本學習能力
在零樣本/少樣本設定下仍能取得優異表現,降低下游任務微調成本
多任務支持
支持生成、分類、填空等多種自然語言處理任務

模型能力

中文文本生成
對話系統構建
文章續寫
成語填空
文本分類

使用案例

內容創作
新聞摘要生成
根據新聞正文自動生成摘要
在TNEWS數據集零樣本準確率達70.3%
教育應用
成語填空輔助
自動補全句子中的缺失成語
ChID數據集無監督準確率68.5%
智能對話
短文本對話生成
生成連貫的對話回覆
STC數據集詞級Dist-2達0.233
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase