W

Wav2vec2 Base En Voxpopuli V2

由facebook開發
基於VoxPopuli語料庫的24.1k無標註英語數據預訓練的Wav2Vec2基礎模型,適用於語音識別任務。
下載量 35
發布時間 : 3/2/2022

模型概述

該模型是Facebook的Wav2Vec2基礎版本,專門針對英語語音數據進行預訓練,主要用於自動語音識別(ASR)任務。

模型特點

基於VoxPopuli語料庫
使用VoxPopuli語料庫中的24.1k無標註英語數據進行預訓練,專注於英語語音識別。
16kHz採樣率
模型在16kHz採樣的語音音頻上進行預訓練,使用時需確保輸入音頻為相同採樣率。
無分詞器
該模型僅基於音頻進行預訓練,未配備分詞器,需額外創建並在標註文本數據上進行微調。

模型能力

語音識別
英語語音處理

使用案例

語音識別
英語語音轉文本
將英語語音轉換為文本,適用於語音助手、轉錄服務等場景。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase