V

Voiceguard

由Mrkomiljon開發
基於Wav2Vec2微調的音頻分類器,能夠區分真人語音和AI生成語音。
下載量 127
發布時間 : 12/2/2024

模型概述

該模型用於檢測音頻是否為AI生成,可識別多種TTS模型生成的語音,適用於語音安全驗證場景。

模型特點

高準確率分類
測試集驗證準確率達99.8%,能有效區分真人語音與多種AI生成語音
多模型兼容
支持識別Melgan、DiffWave等多種TTS模型生成的語音
輕量級部署
基於Wav2Vec2-base架構,適合即時推理場景

模型能力

音頻分類
AI生成語音檢測
語音真實性驗證

使用案例

安全驗證
語音釣魚防護
檢測可疑電話中的AI合成語音
可識別99%以上的已知TTS模型生成語音
內容審核
虛假音頻識別
識別社交媒體中的AI生成語音內容
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase