W

Whisper Large V2 Mix Jp

由vumichien開發
基於OpenAI Whisper-large-v2模型在日語語音數據集上微調的自動語音識別(ASR)模型
下載量 93
發布時間 : 12/19/2022

模型概述

該模型是Whisper-large-v2的日語優化版本,專門針對日語語音識別任務進行了微調,在詞錯誤率(WER)和字錯誤率(CER)指標上表現優異。

模型特點

日語優化
在JSUT、JSSS、CSS10和Common Voice日語數據集上專門微調,優化日語語音識別性能
低錯誤率
在測試集上達到7.65%的詞錯誤率(WER)和4.72%的字錯誤率(CER)
高效訓練
採用混合精度訓練和梯度累積技術,優化訓練效率

模型能力

日語語音轉文本
高精度語音識別
長音頻處理

使用案例

語音轉錄
日語會議記錄
將日語會議錄音自動轉換為文字記錄
準確率約92.35% (基於1-WER)
日語媒體字幕生成
為日語視頻內容自動生成字幕
語音助手
日語語音指令識別
用於日語語音助手系統的語音指令理解
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase