W

Wav2vec2 Large Xlsr 53 Hungarian

jonatasgrosmanによって開発
これはハンガリー語音声認識タスクに対して微調整されたXLSR - 53大規模モデルで、Common VoiceとCSS10データセットを基に訓練されています。
ダウンロード数 127.73k
リリース時間 : 3/2/2022

モデル概要

このモデルはfacebook/wav2vec2-large-xlsr-53をハンガリー語で微調整した自動音声認識(ASR)モデルで、16kHzサンプリングレートの音声入力をサポートしています。

モデル特徴

高性能ハンガリー語認識
Common Voiceハンガリー語テストセットで31.40% WERと6.20% CERを達成し、同類のモデルより優れています。
XLSR - 53アーキテクチャに基づく
多言語音声表現学習の大規模事前学習モデルを利用して微調整されています。
言語モデル不要
直接使用でき、追加の言語モデルのサポートは必要ありません。

モデル能力

ハンガリー語音声認識
16kHzオーディオ処理

使用事例

音声文字変換
音声文字起こし
ハンガリー語の音声内容を文字に変換します。
正確率約93.8%(CERに基づく)
音声アシスタント
ハンガリー語音声指令認識
ハンガリー語音声アシスタントのフロントエンド音声認識に使用されます。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase