M

Monsoon Whisper Medium Gigaspeech2

Developed by scb10x
Monsoon-Whisper-Medium-GigaSpeech2 是一款泰語自動語音識別(ASR)模型,基於Whisper-Medium並在GigaSpeech2數據集上進行了微調,適用於真實場景下的語音識別。
Downloads 546
Release Time : 7/12/2024

Model Overview

該模型專注於泰語自動語音識別任務,在YouTube音頻和嘈雜環境下的語音識別中表現優異。

Model Features

泰語語音識別
專注於泰語語音識別任務,在真實場景中表現優異。
基於Whisper-Medium微調
基於Whisper-Medium架構,並在GigaSpeech2數據集上進行了微調。
高性能
在WER和CER指標上表現優於同類模型。

Model Capabilities

泰語語音識別
嘈雜環境下的語音識別

Use Cases

語音識別
YouTube音頻轉錄
適用於轉錄YouTube視頻中的泰語語音內容。
嘈雜環境下的語音識別
在嘈雜環境下仍能保持較高的識別準確率。
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase