W

Wav2vec2 Base Timit Asr

由 elgeish 开发
基于facebook/wav2vec2-base在timit_asr数据集上微调的语音识别模型,支持16kHz采样率的语音输入
下载量 174
发布时间 : 3/2/2022

模型简介

这是一个用于自动语音识别(ASR)的模型,专门针对TIMIT数据集进行了优化,能够将英语语音转换为文本

模型特点

无需语言模型
该模型可直接使用,无需额外语言模型支持
16kHz采样率支持
专门优化用于处理16kHz采样率的语音输入
TIMIT数据集优化
在TIMIT ASR数据集上进行了专门微调

模型能力

英语语音识别
语音转文本
自动语音转录

使用案例

语音转录
语音转文字
将英语语音转换为文本格式
如示例所示,能够准确转录大部分内容,但在某些单词上可能存在小错误
语音分析
语音内容分析
分析语音内容以提取关键信息
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase