Wav2vec2 Base 10k Voxpopuli Ft Es
基于Facebook Wav2Vec2基础模型,在VoxPopuli语料库的10K未标注子集上预训练,并在西班牙语转录数据上微调的语音识别模型。
Downloads 34
Release Time : 3/2/2022
Model Overview
该模型是一个自动语音识别(ASR)系统,专门针对西班牙语语音转录任务进行了优化,适用于将西班牙语语音转换为文本。
Model Features
多语言预训练基础
基于VoxPopuli多语言语料库进行预训练,具有强大的语音特征提取能力
西班牙语专门优化
在西班牙语转录数据上进行微调,针对西班牙语语音特点进行了专门优化
端到端语音识别
直接从原始音频输入生成文本输出,无需复杂的特征工程
Model Capabilities
西班牙语语音识别
音频转录
语音转文本
Use Cases
语音转录
会议记录自动生成
将西班牙语会议录音自动转录为文字记录
提高会议记录效率,减少人工转录时间
媒体字幕生成
为西班牙语视频内容自动生成字幕
提高媒体内容可访问性,降低字幕制作成本
语音助手
西班牙语语音命令识别
用于西班牙语语音助手中的命令识别
提升语音交互系统的准确性和用户体验
Featured Recommended AI Models
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers Supports Multiple Languages

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers English

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统 Chinese
R
uer
2,694
98