W

Wav2vec2 Large Xlsr Bengali

tanmoyioによって開発
facebook/wav2vec2-large-xlsr-53モデルをベースに微調整されたベンガル語自動音声認識モデルで、OpenSLRデータセットを使用して訓練されています。
ダウンロード数 24.32k
リリース時間 : 3/2/2022

モデル概要

このモデルは、ベンガル語に最適化された自動音声認識(ASR)モデルで、Facebookのwav2vec2-large-xlsr-53アーキテクチャをベースに微調整され、16kHzのサンプリングレートの音声入力をサポートしています。

モデル特徴

ベンガル語最適化
ベンガル語音声認識タスクに特化して微調整されています
言語モデル不要
直接使用でき、追加の言語モデルのサポートは必要ありません
大規模な訓練データ
約19.6万件のベンガル語文を使用して訓練されています

モデル能力

ベンガル語音声認識
オーディオ文字起こし
音声をテキストに変換

使用事例

音声文字起こし
ベンガル語音声文字起こし
ベンガル語の音声をテキストに変換します
単語誤り率88.58%
音声アシスタント
ベンガル語音声指令認識
ベンガル語をサポートする音声アシスタントアプリに使用されます
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase