A

Asr Whisper Large V3 Salt

由Sunbird開發
基於whisper-large-v3適配的語音識別模型,專門針對烏干達地區多種語言優化
下載量 249
發布時間 : 2/4/2025

模型概述

該模型是針對烏干達地區多種語言的語音識別模型,支持盧幹達語、英語、尼揚科勒語、阿喬利語、特索語、盧格巴拉語等多種語言,特別優化了烏干達口音和環境噪音下的識別性能

模型特點

多語言支持
專門針對烏干達地區11種語言優化,包括多種本土語言和烏干達口音英語
環境噪音魯棒性
訓練過程中添加了隨機噪聲和街道環境噪音,增強了實際應用場景下的識別能力
電話語音優化
通過隨機降採樣至8kHz模擬電話語音質量,提高了低質量音頻的識別準確率

模型能力

語音轉文本
多語言識別
自動語言檢測
噪音環境下的語音識別

使用案例

語音轉錄
多語言會議記錄
用於烏干達多語言會議的即時轉錄
支持11種語言的自動識別和轉錄
電話客服記錄
處理低質量的電話語音記錄
針對8kHz採樣率優化的識別能力
語音輔助技術
本地語言語音助手
為烏干達地區開發支持本土語言的語音助手
對多種本土語言的高準確率識別
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase