W

Wav2vec2 Large Baltic Voxpopuli V2

由facebook開發
Facebook的Wav2Vec2大型模型,僅在波羅的海語系的VoxPopuli語料庫上進行了27.5小時的無標註數據預訓練。
下載量 25
發布時間 : 3/2/2022

模型概述

該模型是一個基於Wav2Vec2架構的語音處理模型,專門針對波羅的海語系進行了預訓練,適用於語音識別任務。

模型特點

波羅的海語系預訓練
專門針對波羅的海語系進行了27.5小時的無標註數據預訓練,適用於該語系的語音識別任務。
16kHz音頻採樣
模型預訓練時使用的語音音頻採樣率為16kHz,使用時需確保輸入的語音數據同樣以16kHz採樣。
無監督預訓練
模型在無標註數據上進行預訓練,適用於半監督學習和表徵學習任務。

模型能力

自動語音識別
語音表徵學習

使用案例

語音識別
波羅的海語系語音轉文本
將波羅的海語系的語音音頻轉換為文本
語音研究
語音表徵學習
用於研究語音信號的表徵學習
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase