W

Wav2vec2 Xls R 300m Zh TW

StevenLimcornによって開発
これはfacebook/wav2vec2-xls-r-300mモデルをCOMMON_VOICE - ZH-TWデータセットでファインチューニングした中国語 - 台湾音声認識モデルです。
ダウンロード数 58
リリース時間 : 3/2/2022

モデル概要

このモデルは中国語 - 台湾の音声認識タスクに特化しており、COMMON_VOICEデータセットでファインチューニングトレーニングを行っています。

モデル特徴

中国語 - 台湾音声認識
中国語 - 台湾のアクセントの音声認識に特化して最適化されています。
wav2vec2-xls-rアーキテクチャに基づく
強力なwav2vec2-xls-r-300m事前学習モデルをベースに使用しています。
Common Voiceデータセットでのファインチューニング
Common Voice中国語 - 台湾データセットでファインチューニングトレーニングを行っています。

モデル能力

中国語 - 台湾音声認識
音声文字変換
自動音声認識

使用事例

音声文字起こし
会議記録の文字起こし
中国語 - 台湾のアクセントの会議録音を文字記録に変換します。
単語誤り率(Wer): 0.8594,文字誤り率(Cer): 0.2964
音声アシスタント
中国語 - 台湾のユーザーに音声入力サポートを提供します。
バリアフリーアプリケーション
リアルタイム字幕生成
聴覚障害者にリアルタイム字幕サービスを提供します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase