H

HIYACCENT Wav2Vec2

由codeceejay開發
HIYACCENT是一個針對尼日利亞英語口音優化的語音識別系統,基於Wav2Vec2架構改進,識別性能提升超過20%。
下載量 27
發布時間 : 3/2/2022

模型概述

該模型通過在Facebook Wav2vec架構上新增網絡層來捕捉基線模型與尼日利亞英語語音的差異,並在模型頂層加入CTC損失函數以增強語音-文本對齊的靈活性,專門為受母語發音影響嚴重的尼日利亞英語使用者開發。

模型特點

尼日利亞口音優化
專門針對尼日利亞英語使用者的發音特點進行優化,識別性能提升超過20%。
改進的Wav2Vec2架構
在標準Wav2vec架構上新增網絡層,更好地捕捉尼日利亞英語與標準英語的發音差異。
CTC損失函數
在模型頂層加入CTC損失函數,增強語音-文本對齊的靈活性。

模型能力

尼日利亞口音英語語音識別
16kHz採樣率語音處理

使用案例

語音轉寫
尼日利亞英語語音轉錄
將尼日利亞英語使用者的語音準確轉錄為文本
相比標準模型性能提升20%以上
語音助手
尼日利亞口音語音交互
為尼日利亞用戶提供更準確的語音助手交互體驗
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase