W

Whisper Large V3 Turbo Cantonese Yue English

由JackyHoCL開發
基於Whisper架構優化的粵語與英語混合語音識別模型,支持高精度雙語轉錄
下載量 73
發布時間 : 11/18/2024

模型概述

該模型是Whisper-large-v3的優化版本,專門針對粵語和英語混合語音場景進行微調,適用於語音轉文字、即時字幕生成等任務

模型特點

粵英混合識別
專門優化處理粵語和英語混合的語音內容
高性能轉錄
在混合語音數據集上達到13.7%的字符錯誤率(CER)
大規模訓練
基於Common Voice和專用粵語數據集訓練

模型能力

語音轉文字
即時字幕生成
雙語混合語音識別

使用案例

媒體制作
粵語節目字幕生成
為包含英語術語的粵語節目自動生成字幕
準確識別粵英混合內容
語音助手
雙語語音指令識別
識別用戶混合使用粵語和英語的語音指令
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase