W

Wav2vec2 Xls R Hindi

shivamによって開発
これはfacebook/wav2vec2-xls-r-300mをヒンディー語Common Voice 7.0データセットでファインチューニングした自動音声認識(ASR)モデルです
ダウンロード数 19
リリース時間 : 3/2/2022

モデル概要

このモデルはヒンディー語音声認識タスク専用で、Common Voice 7.0ヒンディー語テストセットで52.3%の単語誤り率(WER)と26.09%の文字誤り率(CER)を達成しました

モデル特徴

ヒンディー語音声認識
ヒンディー語に最適化された音声認識モデル
XLS-Rアーキテクチャベース
facebookのwav2vec2-xls-r-300mをベースモデルとして使用
Common Voiceデータセットでトレーニング
Mozilla Common Voice 7.0ヒンディー語データセットでファインチューニング

モデル能力

ヒンディー語音声からテキストへ変換
自動音声認識

使用事例

音声書き起こし
ヒンディー語音声書き起こし
ヒンディー語音声コンテンツをテキストに変換
テストセットで52.3%の単語誤り率を達成
音声アシスタント
ヒンディー語音声コマンド認識
ヒンディー語音声コマンドを理解するために使用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase