V

Viwav2vec2 Base 100h

由dragonSwing開發
基於VLSP數據集中100小時未標註越南語語音音頻預訓練的Wav2Vec2基礎模型,需在下游任務上微調使用。
下載量 19
發布時間 : 3/2/2022

模型概述

這是一個基於Wav2Vec2架構的越南語語音預訓練模型,使用16kHz採樣率的語音數據進行訓練,適用於自動語音識別等下游任務。

模型特點

越南語語音預訓練
專門針對越南語語音數據進行預訓練,適合越南語語音處理任務。
16kHz採樣支持
模型訓練使用16kHz採樣率的語音數據,使用時需確保輸入數據採樣率一致。
基於Wav2Vec2架構
採用Facebook提出的Wav2Vec2架構,能夠從原始音頻中學習語音結構。

模型能力

語音特徵提取
越南語語音識別

使用案例

語音技術
越南語自動語音識別
通過微調該模型實現越南語語音轉文字功能
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase