W

Wav2vec2 Xls R 300m Zh CN

anantojによって開発
このモデルはfacebook/wav2vec2-xls-r-300mを汎用音声データセットZH-CNでファインチューニングした自動音声認識(ASR)モデルで、中国語普通話の認識をサポートします。
ダウンロード数 37
リリース時間 : 3/2/2022

モデル概要

これは中国語普通話に最適化された自動音声認識モデルで、汎用音声データセットでファインチューニングされており、音声をテキストに変換できます。

モデル特徴

中国語最適化
中国語普通話に特化してファインチューニングされており、中国語音声認識タスクで良好な性能を発揮します
大規模モデルベース
3億パラメータのwav2vec2-xls-r大規模モデルをベースとしており、強力な音声特徴抽出能力を有します
汎用音声データセット
汎用音声データセット(Common Voice)を使用して訓練されており、優れた汎化能力を備えています

モデル能力

中国語音声認識
音声からテキストへの変換
自動音声転写

使用事例

音声転写
会議議事録
会議録音を自動的に文字記録に変換
CER(文字誤り率)約20.59%
音声入力
アプリケーションに音声入力機能を提供
アクセシビリティ技術
リアルタイム字幕
聴覚障害者向けにリアルタイム音声転文字サービスを提供
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase