R

Roberta Base Word Chinese Cluecorpussmall

uerによって開発
CLUECorpusSmallコーパスを用いて事前学習された中国語形態素解析版RoBERTa中型モデルで、形態素解析を用いてシーケンス処理の効率を向上させます。
ダウンロード数 184
リリース時間 : 3/2/2022

モデル概要

このモデルは中国語形態素解析版のRoBERTa事前学習モデルで、文字レベルのモデルに比べて性能が優れ、速度が速く、中国語の自然言語処理タスクに適しています。

モデル特徴

形態素解析最適化
sentencepiece形態素解析技術を用いて、文字レベルのモデルに比べてシーケンスの長さを短縮し、処理速度を向上させます。
複数の規模選択
ミニ(Tiny)からベース(Base)までの5種類の異なる規模の事前学習モデルを提供します。
公開コーパス
公開されているCLUECorpusSmallコーパスを用いて学習されており、結果を再現できます。

モデル能力

テキスト特徴抽出
マスク言語予測
中国語テキスト理解

使用事例

テキスト補完
交通情報補完
「北京への[MASK]は何時発車か」のような交通照会文を補完します。
「便」「高速鉄道」などの交通手段を正確に予測できます。
テキスト特徴抽出
文書ベクトル化
中国語テキストの深層意味表現を取得します。
下流の分類、クラスタリングなどのタスクに使用できます。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase