AST-VoxCelebSpoof合成語音檢測模型 - 開源免費精準識別合成語音

AST VoxCelebSpoof Synthetic Voice Detection

由MattyB95開發

基於MIT/ast-finetuned-audioset-10-10-0.4593微調的合成語音檢測模型，在VoxCelebSpoof數據集上表現出色

下載量 9,518

發布時間 : 1/16/2024

模型概述

該模型用於檢測合成語音，基於AST架構在音頻分類任務上進行微調，特別針對語音欺騙檢測場景優化

高準確率

在評估集上達到99.99%的準確率和F1值

基於AST架構

採用Audio Spectrogram Transformer架構，擅長處理音頻頻譜特徵

專門針對合成語音檢測

針對VoxCelebSpoof數據集優化，特別適合語音欺騙檢測場景

音頻分類

合成語音檢測

語音欺騙識別

安全驗證

語音認證系統

用於檢測語音認證系統中的合成語音攻擊

可有效識別99.99%的合成語音樣本

內容審核

虛假音頻檢測

識別社交媒體上的AI生成虛假音頻內容

訓練損失值	輪數	步數	驗證損失值	準確率	F1值	精確率	召回率
2218896740319.232	1.0	29527	611463921664.0	0.9998	0.9998	0.9999	0.9997
522149441830.912	2.0	59054	284563668992.0	0.9997	0.9997	0.9999	0.9996
0.0	3.0	88581	89136693248.0	0.9999	0.9999	1.0	0.9998