W

Wav2vec2 Bn 300m

Tahsin-Mayeeshaによって開発
facebook/wav2vec2-xls-r-300mをファインチューニングしたベンガル語自動音声認識モデル、OPENSLR_SLR53データセットでトレーニング
ダウンロード数 25
リリース時間 : 3/2/2022

モデル概要

これはベンガル語に最適化された自動音声認識(ASR)モデルで、wav2vec2-xls-r-300mアーキテクチャを基に微調整され、OpenSLRデータセットで優れた性能を発揮します

モデル特徴

高精度ベンガル語認識
OpenSLRテストセットで17.78%の単語誤り率(WER)と4.39%の文字誤り率(CER)を達成
言語モデル統合サポート
5-gram言語モデルと組み合わせることで認識精度をさらに向上可能
大規模トレーニングデータ
OPENSLR_SLR53データセットの218,703サンプルを使用してトレーニング

モデル能力

ベンガル語音声認識
音声からテキストへの変換
言語モデル拡張サポート

使用事例

音声文字起こし
ベンガル語音声テキスト化
ベンガル語音声コンテンツをテキストに変換
テストセットで0.17776 WER(言語モデル使用時)を達成
音声アシスタント
ベンガル語音声インタラクション
ベンガル語音声アシスタントに音声認識機能を提供
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase