A

Asr Whisper Large V3 Salt

Sunbirdによって開発
whisper-large-v3を基に適応した音声認識モデルで、ウガンダ地域の複数言語に特化して最適化
ダウンロード数 249
リリース時間 : 2/4/2025

モデル概要

このモデルはウガンダ地域の複数言語に対応した音声認識モデルで、ルガンダ語、英語、ニャンコレ語、アチョリ語、テソ語、ルグバラ語など多様な言語をサポートし、特にウガンダのアクセントや環境ノイズ下での認識性能を最適化

モデル特徴

多言語サポート
ウガンダ地域の11言語に特化して最適化、複数の現地言語とウガンダアクセントの英語を含む
環境ノイズ耐性
ランダムノイズや街中環境音を学習データに追加し、実用環境下での認識能力を強化
電話音声最適化
8kHzへのダウンサンプリングで電話音声品質をシミュレートし、低品質音声の認識精度向上

モデル能力

音声からテキストへの変換
多言語認識
自動言語検出
ノイズ環境下での音声認識

使用事例

音声文字起こし
多言語会議議事録
ウガンダの多言語会議のリアルタイム文字起こしに利用
11言語の自動認識と文字起こしをサポート
電話対応記録
低品質な電話音声記録の処理
8kHzサンプリングレートに最適化された認識能力
音声支援技術
現地言語音声アシスタント
ウガンダ地域向けに現地言語をサポートする音声アシスタント開発
複数の現地言語に対する高精度な認識
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase