B

Breeze ASR 25

由MediaTek-Research開發
Breeze ASR 25 是一款基於 Whisper-large-v2 微調的先進自動語音識別模型,特別優化了臺灣普通話和普通話-英語代碼切換場景的識別能力。
下載量 10.33k
發布時間 : 6/6/2025

模型概述

Breeze ASR 25 是一款高性能的自動語音識別模型,針對臺灣普通話和普通話-英語代碼切換場景進行了優化,適用於自動字幕生成等任務。

模型特點

臺灣普通話優化
能更精準地識別臺灣普通話語音內容
代碼切換支持
支持普通話-英語代碼切換場景,包括句內切換和句間切換
時間對齊增強
提供更準確的時間對齊功能,適合自動字幕生成
高性能
在多個基準測試中表現優於 Whisper-large-v2

模型能力

語音識別
多語言支持
代碼切換識別
時間對齊

使用案例

字幕生成
自動字幕生成
為視頻內容生成準確的時間對齊字幕
相比 Whisper-large-v2 提高了識別準確率
語音轉寫
臺灣普通話轉寫
準確轉寫臺灣普通話內容
在 CommonVoice16 - zh - TW 數據集上 WERR 降低 19%
代碼切換轉寫
處理普通話-英語混合的語音內容
在 CSZS - zh - en 數據集上 WERR 降低 55.88%
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase