E

Erax WoW Turbo V1.1

由erax-ai開發
專為越南語優化的Whisper Large-v3 Turbo語音識別模型,支持多語言,具有極速響應和高準確度
下載量 666
發布時間 : 3/30/2025

模型概述

基於Whisper Large-v3 Turbo優化的語音識別模型,特別針對越南語進行本地化優化,同時支持11種語言,適用於即時轉錄等多種場景

模型特點

極速響應
處理30秒音頻僅需約350毫秒,適合即時轉錄
多語言支持
支持11種語言,包括越南語所有8個地區的口音
高準確度
主要語言的詞錯率(WER)約為12%,能識別各種口音
大規模訓練
在60萬樣本(約1000小時)的真實環境音頻數據集上訓練
開源免費
採用MIT許可證,無使用限制

模型能力

語音識別
即時轉錄
多語言處理
口音識別

使用案例

即時轉錄
會議記錄
即時轉錄會議內容
幾乎即時生成文字記錄
現場字幕
為直播活動生成即時字幕
低延遲字幕輸出
語音助手
語音控制應用
開發響應迅速的語音控制界面
高準確度的語音指令識別
無障礙工具
聽障輔助
為聽障人士提供語音轉文字服務
即時語音轉文字
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase