W

Wav2vec2 Large Xlsr 53 Chinese Zn Cn Aishell1

qinyueによって開発
facebook/wav2vec2-large-xlsr-53をベースに中国語AISHELL-1データセットでファインチューニングした音声認識モデルで、中国語音声認識タスクをサポートします。
ダウンロード数 22
リリース時間 : 6/16/2022

モデル概要

このモデルは自動音声認識(ASR)モデルで、中国語音声に特化して最適化されており、中国語音声をテキストに変換できます。

モデル特徴

中国語音声認識
中国語音声に特化して最適化された認識モデルで、AISHELL-1データセットで優れた性能を発揮します。
言語モデル不要
追加の言語モデルサポートなしで直接使用できます。
高精度
AISHELL-1テストセットで7.04%の単語誤り率(WER)を達成し、言語モデル使用後は3.96%まで低下可能です。

モデル能力

中国語音声認識
16kHzサンプリングレート音声処理

使用事例

音声文字起こし
会議議事録
会議録音を自動的に文字記録に変換
精度は92.96%(WER 7.04%)に達します
音声アシスタント
中国語音声アシスタントの人間とコンピュータのインタラクションに使用
音声分析
音声内容分析
音声内容のキーワードとテーマを分析
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase