R

Randeng T5 Char 700M Chinese

IDEA-CCNLによって開発
自然言語変換タスクに優れた中国語T5-largeモデルで、BertTokenizer及び中国語文字レベルの語彙を使用しています。
ダウンロード数 75
リリース時間 : 10/22/2022

モデル概要

T5-largeアーキテクチャに基づき中国語最適化された自然言語変換モデルで、様々なテキスト生成・変換タスクに適しています。

モデル特徴

中国語最適化
BertTokenizer及び中英混合語彙を採用し、中国語テキスト処理に特化して最適化されています。
大規模事前学習
コーパス適応事前学習技術(CAPT)を用いて180Gの悟道コーパスで追加学習し、モデル性能を向上させました。
テキスト再構築能力
span corruptionテキスト再構築を事前学習目標としており、テキスト生成・変換タスクに優れています。

モデル能力

テキスト生成
自然言語変換
テキスト再構築

使用事例

テキスト生成
文補完
与えられた部分文から完全な文内容を生成します。
入力例:'北京には長い <extra_id_0>と <extra_id_1>があります。'
自然言語処理
テキスト変換
ある形式のテキストを別の形式に変換します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase