W

Wav2vec2 Base Timit Asr

Developed by elgeish
基于facebook/wav2vec2-base在timit_asr数据集上微调的语音识别模型,支持16kHz采样率的语音输入
Downloads 174
Release Time : 3/2/2022

Model Overview

这是一个用于自动语音识别(ASR)的模型,专门针对TIMIT数据集进行了优化,能够将英语语音转换为文本

Model Features

无需语言模型
该模型可直接使用,无需额外语言模型支持
16kHz采样率支持
专门优化用于处理16kHz采样率的语音输入
TIMIT数据集优化
在TIMIT ASR数据集上进行了专门微调

Model Capabilities

英语语音识别
语音转文本
自动语音转录

Use Cases

语音转录
语音转文字
将英语语音转换为文本格式
如示例所示,能够准确转录大部分内容,但在某些单词上可能存在小错误
语音分析
语音内容分析
分析语音内容以提取关键信息
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase