W

Wav2vec2 Large Xlsr Mr 2

gchhablaniによって開発
これはfacebook/wav2vec2-large-xlsr-53モデルを基に、マラーティー語でファインチューニングした自動音声認識(ASR)モデルで、InterSpeech 2021マラーティー語データセットの一部を使用してトレーニングされました。
ダウンロード数 13
リリース時間 : 3/2/2022

モデル概要

このモデルはマラーティー語の音声認識タスク専用で、マラーティー語音声をテキストに変換できます。

モデル特徴

高精度音声認識
InterSpeech 2021マラーティー語テストセットで19.98%のWERを達成
多サンプルレート対応
16kHzサンプルレート入力をサポートし、8kHz音声をリサンプリング処理可能
言語モデル不要
追加の言語モデルサポートなしで直接使用可能

モデル能力

マラーティー語音声認識
音声からテキストへ
音声内容の文字起こし

使用事例

音声文字起こし
マラーティー語音声文字起こし
マラーティー語音声内容をテキスト形式に変換
テストセットで19.98%の単語誤り率を達成
音声アシスタント
マラーティー語音声コマンド認識
マラーティー語音声コマンドの理解に使用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase