M

Malaysian Whisper Base

由mesolitica開發
基於馬來西亞數據集微調的Whisper基礎模型,支持馬來語和英語的語音識別
下載量 143
發布時間 : 1/1/2024

模型概述

該模型是基於Whisper架構的語音識別模型,專門針對馬來西亞地區的馬來語和英語進行了微調,適用於馬來西亞口音和方言的語音轉文字任務。

模型特點

馬來西亞語言優化
專門針對馬來西亞地區的馬來語和英語口音進行優化,包括標準馬來語和方言
多源訓練數據
使用了包括IMDA語音轉文字數據集、馬來西亞YouTube視頻偽標註數據集等多種數據源進行訓練
雙語支持
同時支持馬來語和英語的語音識別,包括馬來式英語
時間戳支持
能夠生成帶時間戳的轉錄結果

模型能力

馬來語語音識別
英語語音識別
帶時間戳的轉錄
馬來西亞口音識別

使用案例

語音轉錄
會議記錄
將馬來西亞地區的會議錄音自動轉錄為文字
準確識別馬來西亞口音的馬來語和英語
媒體內容字幕生成
為馬來西亞YouTube視頻自動生成字幕
支持方言和當地口音的識別
語音分析
語音數據分析
分析馬來西亞地區的語音數據以獲取洞察
能夠處理馬來西亞特有的語言變體
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase