W

Wav2vec2 Large Lv60 Phoneme Timit English Timit 4k

由excalibur12開發
基於facebook/wav2vec2-large-lv60微調的英語音素識別模型,在TIMIT數據集上取得10.53%的音素錯誤率
下載量 306
發布時間 : 6/17/2024

模型概述

該模型是針對英語音素識別任務優化的語音處理模型,特別適用於音素級別的語音分析

模型特點

低音素錯誤率
在TIMIT測試集上達到10.53%的音素錯誤率,表現優異
精細音素分析
提供元音、塞音、擦音等多種音素類別的詳細錯誤分析
基於wav2vec2架構
利用facebook先進的wav2vec2-large-lv60模型作為基礎

模型能力

英語音素識別
語音特徵提取
音素級錯誤分析

使用案例

語音研究
音素識別研究
用於語言學研究和語音識別系統開發
10.53%的音素錯誤率
教育技術
發音評估
可用於語言學習應用的發音準確性評估
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase