W

Wav2vec2 Large Xlsr Mr 3

gchhablaniによって開発
これはfacebook/wav2vec2-large-xlsr-53モデルを微調整したマラーティー語自動音声認識(ASR)モデルで、OpenSLRとInterSpeech 2021データセットを使用して訓練されています。
ダウンロード数 22
リリース時間 : 3/2/2022

モデル概要

このモデルは専門的にマラーティー語の音声認識タスクに使用され、16kHzのサンプリングレートのオーディオ入力をサポートします。

モデル特徴

複数データセットによる訓練
OpenSLRとInterSpeech 2021の2つのデータセットを組み合わせて訓練することで、モデルの汎化能力を向上させました。
言語モデル不要
追加の言語モデルのサポートなしで直接使用できます。
女性音声最適化
OpenSLRデータには女性の声のみが含まれているため、モデルは女性の音声認識においてより良い性能を発揮します。

モデル能力

マラーティー語音声認識
16kHzオーディオ処理

使用事例

音声文字起こし
マラーティー語音声を文字に変換
マラーティー語の音声を文字内容に変換します。
テストWERは19.05%です。
音声アシスタント
マラーティー語音声指令認識
マラーティー語をサポートする音声アシスタントシステムに使用されます。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase