W

Wav2vec2 Base De Voxpopuli V2

由facebook開發
基於Facebook Wav2Vec2架構的德語語音預訓練模型,使用VoxPopuli語料庫中的23.2k未標註德語數據進行預訓練。
下載量 44
發布時間 : 3/2/2022

模型概述

該模型是一個基礎語音處理模型,專注於德語語音識別任務,通過自監督學習從原始音頻中提取特徵。

模型特點

德語專用預訓練
專門針對德語語音數據進行預訓練,優化了德語語音特徵提取能力。
自監督學習
使用Wav2Vec2的自監督學習方法,從大量未標註語音數據中學習有效表示。
16kHz音頻支持
模型基於16kHz採樣的語音音頻進行預訓練,使用時需確保輸入音頻採樣率匹配。

模型能力

德語語音特徵提取
語音表示學習

使用案例

語音處理
德語語音識別系統
通過微調該模型構建德語自動語音識別系統
需要額外標註數據進行微調才能獲得最佳性能
語音特徵提取器
作為下游語音任務的特徵提取器使用
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase