W

Wav2vec2 Base Timit Demo Colab

由 nadaAlnada 开发
基于anas/wav2vec2-large-xlsr-arabic在common_voice数据集上微调的语音识别模型
下载量 16
发布时间 : 3/2/2022

模型简介

该模型是一个语音识别模型,主要用于将语音转换为文本。基于wav2vec2架构,在common_voice数据集上进行了微调。

模型特点

基于wav2vec2架构
采用先进的wav2vec2架构进行语音识别任务
Common Voice数据集微调
在Common Voice数据集上进行微调,提升识别性能
线性学习率调度
训练过程中使用线性学习率调度器,优化训练效果

模型能力

语音转文本
自动语音识别

使用案例

语音转录
会议记录自动转录
将会议录音自动转换为文字记录
语音笔记转换
将语音备忘录转换为可编辑的文本
辅助技术
语音输入系统
为残障人士提供语音输入解决方案
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase