W

Wav2vec2 Base 10k Voxpopuli

由facebook開發
基於VoxPopuli語料庫1萬條未標註數據預訓練的語音識別基礎模型,支持多語言語音處理
下載量 2,504
發布時間 : 3/2/2022

模型概述

Facebook開發的Wav2Vec2語音識別基礎模型,通過自監督學習從原始音頻中提取語音特徵,適用於多語言自動語音識別任務

模型特點

多語言支持
基於VoxPopuli多語言語料庫訓練,支持多種語言的語音識別
自監督預訓練
使用1萬小時未標註語音數據進行自監督學習,有效捕捉語音特徵
可微調架構
提供基礎模型架構,可針對特定語言或領域進行微調

模型能力

自動語音識別
語音特徵提取
多語言語音處理

使用案例

語音轉文字
會議記錄自動化
將會議錄音自動轉換為文字記錄
字幕生成
為視頻內容自動生成字幕
語音分析
語音內容分析
從語音數據中提取關鍵信息進行分析
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase