A

Ast Fakeaudio Detector

WpythonWによって開発
ASTアーキテクチャを基にファインチューニングした二値分類モデルで、偽造/合成音声の検出に特化しており、精度は96.62%
ダウンロード数 31
リリース時間 : 1/4/2025

モデル概要

このモデルはMIT/ast-finetuned-audiosetを基にファインチューニングしたバージョンで、分類ヘッドを置き換えることで偽造音声検出能力を最適化しています。入力はオーディオスペクトログラムで、出力は偽造/本物の確率です

モデル特徴

高精度検出
Real Fake Speech Dataset 2において96.62%の精度と97.1のF1スコアを達成
専門最適化
偽造音声検出タスク向けに分類層を特別に最適化
効率的処理
バッチ音声処理をサポートし、大規模検知シナリオに適応

モデル能力

音声真正性検証
偽造音声識別
バッチ音声処理

使用事例

セキュリティ検証
音声認証システム
音声認証システムで使用される可能性のある偽造音声を検出
96%以上の偽造サンプルを効果的に識別可能
コンテンツモデレーション
合成音声検出
ソーシャルメディア上の合成/偽造音声コンテンツを識別
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase