E

Erax WoW Turbo V1.1

由 erax-ai 开发
专为越南语优化的Whisper Large-v3 Turbo语音识别模型,支持多语言,具有极速响应和高准确度
下载量 666
发布时间 : 3/30/2025

模型简介

基于Whisper Large-v3 Turbo优化的语音识别模型,特别针对越南语进行本地化优化,同时支持11种语言,适用于实时转录等多种场景

模型特点

极速响应
处理30秒音频仅需约350毫秒,适合实时转录
多语言支持
支持11种语言,包括越南语所有8个地区的口音
高准确度
主要语言的词错率(WER)约为12%,能识别各种口音
大规模训练
在60万样本(约1000小时)的真实环境音频数据集上训练
开源免费
采用MIT许可证,无使用限制

模型能力

语音识别
实时转录
多语言处理
口音识别

使用案例

实时转录
会议记录
实时转录会议内容
几乎实时生成文字记录
现场字幕
为直播活动生成即时字幕
低延迟字幕输出
语音助手
语音控制应用
开发响应迅速的语音控制界面
高准确度的语音指令识别
无障碍工具
听障辅助
为听障人士提供语音转文字服务
实时语音转文字
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase