U

Unispeech Large 1500h Cv Timit

由patrickvonplaten開發
該模型是基於microsoft/unispeech-large-1500h-cv在TIMIT_ASR數據集上微調得到的自動語音識別模型,在評估集上取得了21.96%的詞錯誤率(WER)。
下載量 536
發布時間 : 3/2/2022

模型概述

一個針對英語語音識別任務優化的自動語音識別模型,特別適用於TIMIT數據集類似的語音場景。

模型特點

基於大規模預訓練模型微調
基於1500小時語音數據預訓練的UniSpeech-Large模型進行微調,具有強大的語音特徵提取能力
TIMIT數據集優化
專門針對TIMIT ASR數據集進行優化,在該數據集上表現優異
低詞錯誤率
在評估集上取得了21.96%的詞錯誤率(WER)

模型能力

英語語音識別
連續語音轉文本
音素級別識別

使用案例

語音識別研究
TIMIT數據集語音識別基準測試
可用於語音識別算法的基準測試和比較
WER 21.96%
教育應用
英語發音評估
可用於英語學習者的發音準確度評估
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase