W

Wav2vec2 Base 10k Voxpopuli Ft Es

Developed by facebook
基于Facebook Wav2Vec2基础模型,在VoxPopuli语料库的10K未标注子集上预训练,并在西班牙语转录数据上微调的语音识别模型。
Downloads 34
Release Time : 3/2/2022

Model Overview

该模型是一个自动语音识别(ASR)系统,专门针对西班牙语语音转录任务进行了优化,适用于将西班牙语语音转换为文本。

Model Features

多语言预训练基础
基于VoxPopuli多语言语料库进行预训练,具有强大的语音特征提取能力
西班牙语专门优化
在西班牙语转录数据上进行微调,针对西班牙语语音特点进行了专门优化
端到端语音识别
直接从原始音频输入生成文本输出,无需复杂的特征工程

Model Capabilities

西班牙语语音识别
音频转录
语音转文本

Use Cases

语音转录
会议记录自动生成
将西班牙语会议录音自动转录为文字记录
提高会议记录效率,减少人工转录时间
媒体字幕生成
为西班牙语视频内容自动生成字幕
提高媒体内容可访问性,降低字幕制作成本
语音助手
西班牙语语音命令识别
用于西班牙语语音助手中的命令识别
提升语音交互系统的准确性和用户体验
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase