W

Wav2vec2 Xls R 300m Mr Cv9 With Lm

anuragshasによって開発
Facebook XLS-R-300Mモデルをマラーティー語音声データセットでファインチューニングした自動音声認識モデル
ダウンロード数 23
リリース時間 : 5/8/2022

モデル概要

このモデルはマラーティー語に最適化された自動音声認識(ASR)システムで、Common Voice 9.0マラーティー語データセットでファインチューニングされており、マラーティー語音声をテキストに変換できます。

モデル特徴

高精度マラーティー語認識
Common Voice 9.0テストセットで23.841%の単語誤り率と5.522%の文字誤り率を達成
大規模事前学習モデルベース
XLS-R-300Mモデルをファインチューニングしており、強力な音声特徴抽出能力を継承
最適化されたトレーニングプロセス
線形学習率スケジューリングや勾配蓄積などの技術でトレーニング効果を最適化

モデル能力

マラーティー語音声認識
音声からテキストへの変換
音声内容の文字起こし

使用事例

音声文字起こし
マラーティー語音声書き起こし
マラーティー語音声内容をテキスト形式に変換
テストセットで23.841%の単語誤り率を達成
音声アシスタント
マラーティー語音声コマンド認識
マラーティー語対応の音声アシスタントや対話システムの開発に使用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase