W

W2v Bert 2.0

由facebook開發
基於Conformer架構的語音編碼器,在450萬小時無標註音頻數據上預訓練,支持143種以上語言
下載量 477.05k
發布時間 : 12/19/2023

模型概述

W2v-BERT 2.0是一個強大的語音編碼器,採用Conformer架構,經過大規模多語言音頻數據預訓練,可作為語音處理任務的基礎模型。

模型特點

大規模多語言預訓練
在450萬小時無標註音頻數據上預訓練,覆蓋143種以上語言
先進架構
採用Conformer架構,結合CNN和Transformer的優勢
靈活應用
可作為基礎模型進行微調,適用於多種語音處理任務

模型能力

語音特徵提取
多語言語音處理
音頻嵌入生成

使用案例

語音識別
自動語音識別(ASR)
通過微調模型實現高精度語音轉文本
支持多種語言的語音識別
音頻分析
音頻分類
利用提取的音頻特徵進行分類任務
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase