A

Asr Wav2vec2 Dvoice Amharic

由speechbrain開發
這是一個針對阿姆哈拉語的自動語音識別模型,使用wav2vec 2.0架構和CTC/Attention機制訓練
下載量 96
發布時間 : 6/9/2022

模型概述

該模型是一個端到端的自動語音識別系統,專門用於阿姆哈拉語的語音轉錄任務。它結合了預訓練的wav2vec 2.0模型和CTC解碼器,在DVoice阿姆哈拉語數據集上進行了微調。

模型特點

預訓練模型微調
基於facebook/wav2vec2-large-xlsr-53預訓練模型進行微調,提高了對阿姆哈拉語的識別能力
端到端系統
提供完整的端到端解決方案,包括分詞器和聲學模型
多平臺支持
支持CPU和GPU推理,可靈活部署在不同硬件環境

模型能力

阿姆哈拉語語音識別
音頻轉錄
語音轉文本

使用案例

語音轉錄
阿姆哈拉語語音轉錄
將阿姆哈拉語語音轉換為文本
驗證集CER 6.71%,WER 25.50%
語音助手
阿姆哈拉語語音助手
構建支持阿姆哈拉語的語音交互系統
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase