A

Asr Whisper Large V3 Salt

Developed by Sunbird
基於whisper-large-v3適配的語音識別模型,專門針對烏干達地區多種語言優化
Downloads 249
Release Time : 2/4/2025

Model Overview

該模型是針對烏干達地區多種語言的語音識別模型,支持盧幹達語、英語、尼揚科勒語、阿喬利語、特索語、盧格巴拉語等多種語言,特別優化了烏干達口音和環境噪音下的識別性能

Model Features

多語言支持
專門針對烏干達地區11種語言優化,包括多種本土語言和烏干達口音英語
環境噪音魯棒性
訓練過程中添加了隨機噪聲和街道環境噪音,增強了實際應用場景下的識別能力
電話語音優化
通過隨機降採樣至8kHz模擬電話語音質量,提高了低質量音頻的識別準確率

Model Capabilities

語音轉文本
多語言識別
自動語言檢測
噪音環境下的語音識別

Use Cases

語音轉錄
多語言會議記錄
用於烏干達多語言會議的即時轉錄
支持11種語言的自動識別和轉錄
電話客服記錄
處理低質量的電話語音記錄
針對8kHz採樣率優化的識別能力
語音輔助技術
本地語言語音助手
為烏干達地區開發支持本土語言的語音助手
對多種本土語言的高準確率識別
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase