E

English Speaker Accent Recognition Using Transfer Learning

由keras-io開發
該模型通過從Yamnet提取特徵,對英國和愛爾蘭口音進行分類。
下載量 71
發布時間 : 6/7/2022

模型概述

基於Yamnet特徵提取的密集模型,用於區分英國和愛爾蘭地區的英語口音。模型使用眾包高質量語音數據集訓練,包含來自120名志願者的超過31小時的錄音。

模型特點

遷移學習架構
利用預訓練的Yamnet模型提取音頻特徵,顯著提升小數據集上的分類性能
高質量數據集
使用包含17,877個高質量音頻文件的數據集,覆蓋英國和愛爾蘭多個地區的口音
穩健的模型結構
採用4個密集隱藏層與Dropout層組合,有效防止過擬合

模型能力

英語口音識別
音頻特徵提取
方言分類

使用案例

語音分析
口音識別系統
識別說話者的地域口音特徵
驗證集準確率50%,AUC 0.8909
語音助手優化
根據不同口音優化語音助手的識別效果
教育科技
語言學習輔助
幫助語言學習者識別和模仿特定口音
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase