W

Wav2vec2 Large Xlsr Marathi

sumedhによって開発
facebook/wav2vec2-large-xlsr-53モデルをベースに微調整されたマラーティー語自動音声認識モデルで、OpenSLRマラーティー語データセットで訓練され、テストセットの単語誤り率は12.7%です。
ダウンロード数 5,159
リリース時間 : 3/2/2022

モデル概要

これはマラーティー語自動音声認識(ASR)に特化したモデルで、Facebookのwav2vec2-large-xlsr-53アーキテクチャをベースに微調整され、16kHzサンプリングレートの音声入力に適しています。

モデル特徴

低単語誤り率
テストセットで12.7%の単語誤り率(WER)を達成し、優れた性能を発揮します
性別適応性
訓練データには女性の音声のみが含まれていますが、男性の音声に対しても良好な性能を示します
言語モデル不要
追加の言語モデルのサポートなしで直接使用できます

モデル能力

マラーティー語音声認識
16kHzサンプリングレートの音声処理

使用事例

音声文字起こし
マラーティー語音声を文字に変換
マラーティー語の音声内容を文字に変換します
12.7%の単語誤り率
音声アシスタント
マラーティー語音声指令認識
マラーティー語を理解する音声アシスタントの開発に使用します
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase