V

Viwav2vec2 Base 1.5k

由dragonSwing開發
該模型通過1.5千小時越南語語音數據預訓練得到,適用於越南語語音識別任務,需微調後使用。
下載量 38
發布時間 : 5/3/2022

模型概述

基於Wav2Vec2架構的越南語語音預訓練模型,使用1.5千小時的朗讀與廣播語音數據進行訓練,支持16kHz採樣率的語音輸入。

模型特點

大規模越南語預訓練
使用1.5千小時的越南語語音數據進行預訓練,涵蓋朗讀與廣播語音
16kHz採樣支持
模型針對16kHz採樣的語音數據優化,使用時需確保輸入語音採樣率匹配
需微調使用
模型需在下游任務(如越南語ASR)上進行微調才能發揮最佳效果

模型能力

越南語語音特徵提取
語音表示學習

使用案例

語音技術
越南語語音識別系統
通過微調模型構建越南語ASR系統
語音分析
用於越南語語音特徵分析和表示學習
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase