W

Wav2vec2 Large 100k Voxpopuli

由facebook開發
基於VoxPopuli語料庫10萬條無標註數據預訓練的語音識別模型,支持多語言語音表徵學習
下載量 2,218
發布時間 : 3/2/2022

模型概述

Facebook開發的Wav2Vec2大型預訓練模型,專注於從原始音頻中學習語音結構,適用於語音識別任務

模型特點

多語言支持
基於VoxPopuli多語言語料庫訓練,支持多種語言的語音處理
無監督預訓練
使用10萬小時無標註語音數據進行預訓練,學習語音的通用表徵
可微調架構
模型設計便於針對特定語言或任務進行微調

模型能力

語音表徵學習
自動語音識別
多語言語音處理

使用案例

語音技術
語音識別系統
通過微調模型構建特定語言的語音識別系統
語音數據分析
用於語音內容的分析和處理
教育技術
語言學習應用
構建語音評估和發音糾正工具
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase