W

Wav2vec2 Large Xlsr Bengali

arijitxによって開発
facebook/wav2vec2-large-xlsr - 53をベースに微調整されたベンガル語自動音声認識モデルで、OpenSLRデータセットの約4万件の音声データで訓練されています。
ダウンロード数 758
リリース時間 : 3/2/2022

モデル概要

これはベンガル語の自動音声認識(ASR)に特化したモデルで、ベンガル語の音声をテキストに変換することができます。

モデル特徴

高精度ベンガル語認識
ベンガル語に特化して最適化された音声認識モデルで、テストセットで32.45%の単語誤り率を達成しています。
XLSRアーキテクチャベース
facebookのwav2vec2 - large - xlsr - 53モデルをベースに微調整され、多言語音声表現学習を利用しています。
大規模訓練データ
OpenSLRデータセットの約4万件のベンガル語音声データを使用して訓練されています。

モデル能力

ベンガル語音声認識
オーディオをテキストに変換
16kHzサンプリングレートの音声処理

使用事例

音声書き起こし
ベンガル語音声の文字起こし
ベンガル語の音声内容をテキスト形式に変換します。
単語誤り率32.45%
音声アシスタント
ベンガル語音声インタラクション
ベンガル語の音声アシスタントに音声認識機能を提供します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase