M

Malaysian Whisper Base

由 mesolitica 开发
基于马来西亚数据集微调的Whisper基础模型,支持马来语和英语的语音识别
下载量 143
发布时间 : 1/1/2024

模型简介

该模型是基于Whisper架构的语音识别模型,专门针对马来西亚地区的马来语和英语进行了微调,适用于马来西亚口音和方言的语音转文字任务。

模型特点

马来西亚语言优化
专门针对马来西亚地区的马来语和英语口音进行优化,包括标准马来语和方言
多源训练数据
使用了包括IMDA语音转文字数据集、马来西亚YouTube视频伪标注数据集等多种数据源进行训练
双语支持
同时支持马来语和英语的语音识别,包括马来式英语
时间戳支持
能够生成带时间戳的转录结果

模型能力

马来语语音识别
英语语音识别
带时间戳的转录
马来西亚口音识别

使用案例

语音转录
会议记录
将马来西亚地区的会议录音自动转录为文字
准确识别马来西亚口音的马来语和英语
媒体内容字幕生成
为马来西亚YouTube视频自动生成字幕
支持方言和当地口音的识别
语音分析
语音数据分析
分析马来西亚地区的语音数据以获取洞察
能够处理马来西亚特有的语言变体
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase