P

Phowhisper Medium

由 vinai 开发
PhoWhisper 是一个专为越南语自动语音识别(ASR)设计的模型系列,通过在844小时越南语口音数据集上微调Whisper模型实现高鲁棒性。
下载量 2,999
发布时间 : 2/18/2024

模型简介

PhoWhisper 提供五个版本,专注于越南语自动语音识别任务,在越南语ASR基准数据集上达到当前最优性能。

模型特点

多口音适应
在包含844小时不同越南口音的数据集上训练,具备强大的口音鲁棒性
最优性能
在越南语ASR基准数据集上达到当前最优性能
多版本选择
提供五个不同版本的模型以满足不同需求

模型能力

越南语语音识别
多口音语音处理

使用案例

语音转录
越南语会议记录
将越南语会议录音自动转录为文字
高准确率的转录结果
媒体字幕生成
为越南语视频内容自动生成字幕
支持多种越南口音的字幕生成
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase