W

Whisper Large V2 Ta

由 anuragshas 开发
基于OpenAI Whisper Large-v2模型微调的泰米尔语自动语音识别(ASR)模型,在Common Voice 11.0泰米尔语测试集上达到8.45%的词错误率
下载量 15
发布时间 : 12/17/2022

模型简介

这是一个专门针对泰米尔语优化的语音识别模型,基于OpenAI的Whisper架构进行微调,适用于泰米尔语语音转文字任务

模型特点

高精度泰米尔语识别
在Common Voice泰米尔语测试集上达到8.45%的词错误率
基于Whisper架构
采用OpenAI Whisper Large-v2的强大语音识别架构
多GPU训练优化
支持分布式多GPU训练,提高训练效率

模型能力

泰米尔语语音识别
语音转文字
音频转录

使用案例

语音转录
泰米尔语会议记录
将泰米尔语会议录音自动转为文字记录
高准确率的转录结果
媒体字幕生成
为泰米尔语视频内容自动生成字幕
支持媒体内容无障碍访问
语音助手
泰米尔语语音指令识别
用于泰米尔语语音助手应用的指令识别
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase