W

Wav2vec2 Large Slavic Voxpopuli V2

由facebook開發
Facebook的Wav2Vec2大型模型,僅在斯拉夫語系的VoxPopuli語料庫上進行了88.99999999999999小時的未標註數據預訓練。
下載量 26
發布時間 : 3/2/2022

模型概述

該模型是一個基於Wav2Vec2架構的語音處理模型,專門針對斯拉夫語系進行預訓練,適用於語音識別任務。

模型特點

斯拉夫語系優化
專門針對斯拉夫語系進行預訓練,優化了該語系的語音識別性能。
大規模預訓練
基於VoxPopuli語料庫進行了88.99999999999999小時的未標註數據預訓練。
16kHz音頻支持
模型在16kHz採樣的語音音頻上進行預訓練,使用時需確保輸入音頻採樣率一致。

模型能力

語音識別
斯拉夫語系語音處理

使用案例

語音識別
斯拉夫語系語音轉文本
將斯拉夫語系的語音轉換為文本,適用於語音助手、字幕生成等場景。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase