B

Belle Whisper Large V3 Zh

由BELLE-2開發
基於whisper-large-v3微調優化的中文語音識別模型,在多箇中文語音基準測試中性能顯著提升
下載量 1,666
發布時間 : 3/11/2024

模型概述

該模型是針對中文語音識別任務優化的Whisper模型,通過全參數微調在多箇中文語音數據集上實現了性能提升

模型特點

中文語音識別優化
專門針對中文語音進行微調,在多箇中文語音基準測試中性能提升24%-65%
複雜場景適應能力
在會議等複雜聲學場景中表現優異,相比前代模型有顯著提升
多數據集訓練
使用AISHELL-1、AISHELL-2、WenetSpeech和HKUST等多個高質量中文語音數據集進行訓練

模型能力

中文語音轉文本
高精度語音識別
複雜場景語音處理

使用案例

語音轉寫
會議記錄
將會議錄音轉換為文字記錄
在wenetspeech_meeting數據集上錯誤率僅11.246%
語音輸入
為應用程序提供中文語音輸入功能
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase