C

CPM Generate

TsinghuaAIによって開発
CPMはTransformerに基づく26億パラメータの中国語事前学習言語モデルで、100GBの中国語コーパスを使用して学習され、様々な自然言語処理タスクをサポートします。
ダウンロード数 622
リリース時間 : 3/2/2022

モデル概要

大規模生成型中国語事前学習言語モデルで、テキスト生成、対話システム、穴埋めなどの下流タスクに適しています。

モデル特徴

大規模中国語事前学習
100GBの多様な中国語コーパスを使用して学習され、百科事典、ウェブページ、ニュースなどの多領域のデータをカバーしています。
少ショット学習能力
ゼロショット/少ショット設定でも優れた性能を発揮し、下流タスクの微調整コストを削減します。
多タスクサポート
生成、分類、穴埋めなどの様々な自然言語処理タスクをサポートします。

モデル能力

中国語テキスト生成
対話システム構築
文章の続き生成
成語穴埋め
テキスト分類

使用事例

コンテンツ作成
ニュース要約生成
ニュース本文に基づいて自動的に要約を生成します。
TNEWSデータセットのゼロショット正解率は70.3%です。
教育応用
成語穴埋め支援
文章中の欠けている成語を自動的に補完します。
ChIDデータセットの無監督正解率は68.5%です。
スマート対話
短テキスト対話生成
一貫した対話応答を生成します。
STCデータセットの単語レベルのDist - 2は0.233です。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase