B

Banglaasr

bangla-speech-processingによって開発
これはWhisper smallアーキテクチャに基づくベンガル語自動音声認識モデルで、約400時間のMozilla Common Voiceデータセットでファインチューニングされ、単語誤り率4.58%を達成
ダウンロード数 782
リリース時間 : 6/22/2023

モデル概要

このモデルはベンガル語音声認識タスク専用に設計され、TransformerアーキテクチャのWhisperモデルをファインチューニング

モデル特徴

高精度認識
ベンガル語音声認識タスクで4.58%の単語誤り率を達成
専用最適化
ベンガル語に特化して最適化されたWhisperモデル
中規模サイズ
244Mパラメータのsmallバリアントを採用し、性能とリソース要件のバランスを実現

モデル能力

ベンガル語音声からテキストへの変換
長い音声処理
リアルタイム音声認識

使用事例

音声文字起こし
音声記録の転記
ベンガル語の音声記録を自動的にテキストに変換
95.42%の精度
音声アシスタント
ベンガル語音声アシスタントに認識能力を提供
教育
言語学習支援
学習者がベンガル語の発音とリスニングを練習するのを支援
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase