C

Chinese Hubert Base

Developed by TencentGameMate
基于1万小时WenetSpeech L子集预训练的中文语音模型,适用于语音相关任务
Downloads 1,312
Release Time : 6/2/2022

Model Overview

该模型是针对中文语音数据的预训练模型,采用Wav2Vec2/HuBERT架构,可用于语音特征提取等任务。需要配合分词器和标注数据进行微调才能用于语音识别。

Model Features

大规模中文预训练
基于1万小时的中文语音数据(WenetSpeech L子集)进行预训练
轻量级部署
支持半精度推理(half precision),降低计算资源需求
灵活适配
可作为基础模型适配多种下游语音任务

Model Capabilities

语音特征提取
语音表示学习

Use Cases

语音处理
语音识别基础模型
通过微调可用于构建中文语音识别系统
需配合分词器和标注数据微调
语音特征提取
提取语音的高级特征表示
可用于后续语音分析任务
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase