C

Chinese Hubert Base

TencentGameMateによって開発
1万時間のWenetSpeech Lサブセットで事前学習された中国語音声モデル、音声関連タスクに適応
ダウンロード数 1,312
リリース時間 : 6/2/2022

モデル概要

このモデルは中国語音声データ向けの事前学習モデルで、Wav2Vec2/HuBERTアーキテクチャを採用し、音声特徴抽出などのタスクに使用可能。音声認識に使用するには、トークナイザーとアノテーションデータによるファインチューニングが必要です。

モデル特徴

大規模中国語事前学習
1万時間の中国語音声データ(WenetSpeech Lサブセット)で事前学習
軽量デプロイ
半精度推論(half precision)をサポートし、計算リソース要件を低減
柔軟な適応
基盤モデルとして様々な下流音声タスクに適応可能

モデル能力

音声特徴抽出
音声表現学習

使用事例

音声処理
音声認識基盤モデル
ファインチューニングにより中国語音声認識システム構築に使用可能
トークナイザーとアノテーションデータによるファインチューニングが必要
音声特徴抽出
音声の高レベル特徴表現を抽出
後続の音声分析タスクに使用可能
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase