W

Wenzhong GPT2 3.5B

由IDEA-CCNL開發
專注於處理自然語言生成任務,當前最大的中文GPT2模型。
下載量 78
發布時間 : 3/2/2022

模型概述

該模型採用GPT架構並應用於中文語料,包含30層解碼器結構,參數量達35億,規模超過原版GPT2-XL。

模型特點

大規模中文GPT模型
參數量達35億,是目前最大的中文GPT2模型。
高效預訓練
在100GB中文語料上進行預訓練,消耗32張NVIDIA A100顯卡約28小時。
單向語言模型
專注於構建強大的單向語言模型,適用於自然語言生成任務。

模型能力

文本生成
語言建模

使用案例

文本生成
文本補全
根據給定的開頭生成連貫的後續文本。
內容創作
生成文章、故事或其他創意寫作內容。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase