M

Monsoon Whisper Medium Gigaspeech2

由scb10x開發
Monsoon-Whisper-Medium-GigaSpeech2 是一款泰語自動語音識別(ASR)模型,基於Whisper-Medium並在GigaSpeech2數據集上進行了微調,適用於真實場景下的語音識別。
下載量 546
發布時間 : 7/12/2024

模型概述

該模型專注於泰語自動語音識別任務,在YouTube音頻和嘈雜環境下的語音識別中表現優異。

模型特點

泰語語音識別
專注於泰語語音識別任務,在真實場景中表現優異。
基於Whisper-Medium微調
基於Whisper-Medium架構,並在GigaSpeech2數據集上進行了微調。
高性能
在WER和CER指標上表現優於同類模型。

模型能力

泰語語音識別
嘈雜環境下的語音識別

使用案例

語音識別
YouTube音頻轉錄
適用於轉錄YouTube視頻中的泰語語音內容。
嘈雜環境下的語音識別
在嘈雜環境下仍能保持較高的識別準確率。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase