W

Wav2vec2 Xls R 300m Bangla Command Generated Data Finetune

hrdiptoによって開発
wav2vec2-xls-r-300mアーキテクチャに基づくベンガル語音声認識モデルで、コマンド認識タスクに対して微調整されています。
ダウンロード数 24
リリース時間 : 3/2/2022

モデル概要

このモデルはhrdipto/wav2vec2-xls-r-300m-bangla-command-dataをベースに微調整されたバージョンで、専門的にベンガル語コマンド認識タスクに使用されます。

モデル特徴

高効率音声認識
ベンガル語コマンド認識に対して最適化されており、評価時の単語誤り率はわずか0.0208です。
高速推論
評価時に毎秒75.217個のサンプルを処理でき、リアルタイムアプリケーションシナリオに適しています。
転移学習
事前学習されたwav2vec2-xls-r-300mモデルをベースに微調整されており、事前学習の知識を十分に活用しています。

モデル能力

ベンガル語音声認識
コマンド単語認識
リアルタイム音声処理

使用事例

スマートホーム制御
音声による機器制御
ベンガル語の音声コマンドでスマートホーム機器を制御します。
高い精度でのコマンド認識
音声アシスタント
ローカライズされた音声インタラクション
ベンガル語ユーザーに音声インタラクション機能を提供します。
低遅延の音声認識
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase