E

Exp W2v2t Zh Cn Wavlm S596

由jonatasgrosman開發
基於microsoft/wavlm-large模型微調的中文語音識別模型,支持簡體中文,使用Common Voice 7.0 (zh-CN)數據集訓練。
下載量 22
發布時間 : 7/10/2022

模型概述

該模型是一個針對中文簡體語音識別任務優化的模型,基於WavLM-large架構微調,適用於16kHz採樣率的語音輸入。

模型特點

基於WavLM-large架構
採用微軟WavLM-large預訓練模型作為基礎,具備強大的語音特徵提取能力。
中文語音識別優化
專門針對中文簡體語音進行微調,在中文語音識別任務上表現更優。
16kHz採樣率支持
適配常見的16kHz採樣率語音輸入,便於實際應用部署。

模型能力

中文語音識別
語音轉文本

使用案例

語音轉寫
會議記錄轉寫
將中文會議錄音自動轉寫為文字記錄
語音輸入法
支持通過語音輸入轉換為文字
無障礙應用
即時字幕生成
為視頻內容或即時對話生成中文字幕
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase