W

Wav2vec2 Large Xls R 300m Pun Colab

由shibli開發
基於facebook/wav2vec2-xls-r-300m在common_voice數據集上微調的語音識別模型
下載量 20
發布時間 : 3/2/2022

模型概述

該模型是wav2vec2-xls-r-300m的微調版本,專注於語音識別任務,特別適用於處理common_voice數據集中的語音內容。

模型特點

大規模預訓練模型微調
基於3億參數的wav2vec2-xls-r-300m模型進行微調,具備強大的語音特徵提取能力
Common Voice數據集優化
專門針對Common Voice數據集進行優化,可能在該數據集上表現更佳
高效訓練配置
採用混合精度訓練和梯度累積等技術,提高訓練效率

模型能力

語音識別
語音轉文本
音頻內容理解

使用案例

語音轉錄
語音內容轉錄
將語音內容轉換為文本格式
語音助手
語音命令識別
識別和理解語音命令
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase