chinese-hubert-base开源中文语音模型 - 免费部署助力各类语音相关任务

Home

Chinese Hubert Base

Developed by TencentGameMate

基于1万小时WenetSpeech L子集预训练的中文语音模型，适用于语音相关任务

语音识别

Transformers

Open Source License:MIT #中文语音预训练 #无监督特征提取 #Wav2Vec2架构

Downloads 1,312

Release Time : 6/2/2022

Model Overview

该模型是针对中文语音数据的预训练模型，采用Wav2Vec2/HuBERT架构，可用于语音特征提取等任务。需要配合分词器和标注数据进行微调才能用于语音识别。

Model Features

大规模中文预训练

基于1万小时的中文语音数据(WenetSpeech L子集)进行预训练

轻量级部署

支持半精度推理(half precision)，降低计算资源需求

灵活适配

可作为基础模型适配多种下游语音任务

Model Capabilities

语音特征提取

语音表示学习

Use Cases

语音处理

语音识别基础模型

通过微调可用于构建中文语音识别系统

需配合分词器和标注数据微调

语音特征提取

提取语音的高级特征表示

可用于后续语音分析任务

Featured Recommended AI Models

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers Supports Multiple Languages

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统 Chinese

uer

2,694

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

Chinese Hubert Base

Model Overview

Model Features

Model Capabilities

Use Cases

🚀 中文语音预训练模型

🚀 快速开始

安装依赖

使用示例

基础用法

📄 许可证