W

Wav2vec2 Large West Germanic Voxpopuli V2

由facebook開發
Facebook的Wav2Vec2大型模型,僅在西日耳曼語系的VoxPopuli語料庫66.3無標註數據上進行預訓練。
下載量 25
發布時間 : 3/2/2022

模型概述

該模型是一個基於Wav2Vec2架構的語音處理模型,主要用於語音識別任務,支持西日耳曼語系的語言。

模型特點

大規模預訓練
模型在66.3小時的西日耳曼語系無標註語音數據上進行預訓練,具有較強的語音表徵能力。
16kHz採樣率支持
模型基於16kHz採樣的語音音頻進行預訓練,使用時需確保輸入語音同樣以16kHz採樣。
多語言支持
模型支持西日耳曼語系的語言,適用於多種語言的語音識別任務。

模型能力

語音識別
語音表徵學習

使用案例

語音識別
西日耳曼語系語音轉文本
將西日耳曼語系的語音轉換為文本,適用於語音助手、字幕生成等場景。
語音研究
語音表徵學習
用於語音表徵學習研究,提取語音特徵用於下游任務。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase