W

Wav2vec2 Base Hu Voxpopuli V2

由facebook開發
基於Facebook Wav2Vec2架構的語音預訓練模型,在VoxPopuli語料庫的匈牙利語數據上預訓練
下載量 30
發布時間 : 3/2/2022

模型概述

這是一個基於Wav2Vec2架構的語音模型,專門在VoxPopuli語料庫的17.7k未標註匈牙利語數據上進行預訓練。模型適用於16kHz採樣的語音音頻處理,主要用於語音表示學習,可作為語音識別等任務的基礎模型。

模型特點

匈牙利語優化
專門在匈牙利語語音數據上預訓練,適合匈牙利語語音處理任務
Wav2Vec2架構
採用Facebook先進的Wav2Vec2架構,能夠從原始音頻中學習語音表示
16kHz音頻支持
模型針對16kHz採樣的語音音頻優化,使用時需確保輸入音頻符合此採樣率

模型能力

語音表示學習
語音特徵提取

使用案例

語音處理
匈牙利語語音識別
可作為基礎模型,通過微調用於匈牙利語自動語音識別系統
需要額外標註數據進行微調
語音表示學習
用於提取匈牙利語語音的特徵表示
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase