A

AST VoxCelebSpoof Synthetic Voice Detection

由MattyB95開發
基於MIT/ast-finetuned-audioset-10-10-0.4593微調的合成語音檢測模型,在VoxCelebSpoof數據集上表現出色
下載量 9,518
發布時間 : 1/16/2024

模型概述

該模型用於檢測合成語音,基於AST架構在音頻分類任務上進行微調,特別針對語音欺騙檢測場景優化

模型特點

高準確率
在評估集上達到99.99%的準確率和F1值
基於AST架構
採用Audio Spectrogram Transformer架構,擅長處理音頻頻譜特徵
專門針對合成語音檢測
針對VoxCelebSpoof數據集優化,特別適合語音欺騙檢測場景

模型能力

音頻分類
合成語音檢測
語音欺騙識別

使用案例

安全驗證
語音認證系統
用於檢測語音認證系統中的合成語音攻擊
可有效識別99.99%的合成語音樣本
內容審核
虛假音頻檢測
識別社交媒體上的AI生成虛假音頻內容
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase