D

Digit Mask Data2vec Audio Base 960h Ft

由mazkooleg開發
基於data2vec-audio-base-960h微調的音頻數字識別模型,在數字掩碼增強數據集上表現出色
下載量 14
發布時間 : 5/7/2023

模型概述

該模型是針對音頻數字識別任務優化的版本,特別適用於處理數字掩碼場景下的音頻數據

模型特點

高準確率數字識別
在評估集上達到99.91%的準確率和F1值
針對數字掩碼優化
專門針對數字掩碼場景進行訓練和優化
基於data2vec微調
基於強大的data2vec音頻基礎模型進行微調

模型能力

音頻數字識別
處理掩碼音頻
高精度分類

使用案例

語音處理
電話數字識別
識別電話語音中的數字輸入
99.91%準確率
語音驗證碼識別
解析語音驗證碼中的數字序列
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase