W

Wav2vec2 Base 10k Voxpopuli

Developed by facebook
基於VoxPopuli語料庫1萬條未標註數據預訓練的語音識別基礎模型,支持多語言語音處理
Downloads 2,504
Release Time : 3/2/2022

Model Overview

Facebook開發的Wav2Vec2語音識別基礎模型,通過自監督學習從原始音頻中提取語音特徵,適用於多語言自動語音識別任務

Model Features

多語言支持
基於VoxPopuli多語言語料庫訓練,支持多種語言的語音識別
自監督預訓練
使用1萬小時未標註語音數據進行自監督學習,有效捕捉語音特徵
可微調架構
提供基礎模型架構,可針對特定語言或領域進行微調

Model Capabilities

自動語音識別
語音特徵提取
多語言語音處理

Use Cases

語音轉文字
會議記錄自動化
將會議錄音自動轉換為文字記錄
字幕生成
為視頻內容自動生成字幕
語音分析
語音內容分析
從語音數據中提取關鍵信息進行分析
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase