W

Wav2vec2 Large Lv60 Phoneme Timit English Timit 4k Simplified

由excalibur12開發
基於facebook/wav2vec2-large-lv60在TIMIT數據集上微調的語音識別模型,專注於音素識別任務。
下載量 271
發布時間 : 6/17/2024

模型概述

該模型是針對英語音素識別任務優化的語音識別模型,在簡化版TIMIT音素集上訓練,具有較低的音素錯誤率。

模型特點

高效音素識別
在TIMIT評估集上達到8.38%的低音素錯誤率
簡化音素集
對原始TIMIT音素集進行了合併簡化處理,提高了識別效率
基於預訓練模型
基於facebook/wav2vec2-large-lv60預訓練模型微調,具有強大的語音特徵提取能力

模型能力

英語音素識別
語音特徵提取
自動語音識別

使用案例

語音研究
音素分析
用於語音學和語言學研究中音素級別的分析
8.38%的音素錯誤率
語音識別系統
語音識別前端
作為語音識別系統的音素識別組件
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase