W

Wenzhong GPT2 3.5B

Developed by IDEA-CCNL
自然言語生成タスクの処理に特化した、現在最大の中国語GPT2モデルです。
Downloads 78
Release Time : 3/2/2022

Model Overview

このモデルはGPTアーキテクチャを採用し、中国語コーパスに適用されています。30層のデコーダ構造を含み、パラメータ数は35億に達し、オリジナルのGPT2-XLを上回る規模です。

Model Features

大規模中国語GPTモデル
パラメータ数が35億に達し、現在最大の中国語GPT2モデルです。
効率的な事前学習
100GBの中国語コーパスで事前学習を行い、32枚のNVIDIA A100グラフィックカードを約28時間使用しました。
単向言語モデル
強力な単向言語モデルの構築に特化しており、自然言語生成タスクに適しています。

Model Capabilities

テキスト生成
言語モデリング

Use Cases

テキスト生成
テキスト補完
与えられた冒頭に基づいて、首尾一貫した後続のテキストを生成します。
コンテンツ作成
記事、物語、またはその他の創作的な文章コンテンツを生成します。
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase