AST - ASVspoof5オープンソース合成音声検出モデル - オーディオが合成音声かどうかを精度よく識別

AST ASVspoof5 Synthetic Voice Detection

MattyB95によって開発

MIT/ast-finetuned-audioset-10-10-0.4593を微調整した合成音声検出モデルで、音声が合成音声かどうかを識別します。

ダウンロード数 281

リリース時間 : 7/20/2024

モデル概要

このモデルは音声分類モデルで、合成音声の検出に特化しており、検証セットで高い精度とF1スコアを示しています。

高精度

検証セットで83.33%の精度を達成し、優れた性能を示しています。

バランス性能

F1スコアが0.8892で、精度と再現率の間で良好なバランスを実現しています。

微調整最適化

事前学習モデルを微調整し、合成音声検出タスクに適応させています。

音声分類

合成音声検出

セキュリティ検証

音声認証システム

音声認証システムにおける合成音声攻撃の可能性を検出します。

合成音声を効果的に識別し、システムが騙されるリスクを低減します。

コンテンツ審査

偽音声検出

ソーシャルメディアやニュースプラットフォーム上の合成音声コンテンツを識別します。

プラットフォームが潜在的な虚偽または誤解を招く音声コンテンツをフィルタリングするのに役立ちます。

プロパティ	詳細
モデルタイプ	AST-ASVspoof5-Synthetic-Voice-Detection
ベースモデル	MIT/ast-finetuned-audioset-10-10-0.4593
生成元	Trainerによる自動生成
データセット	audiofolder
評価指標	正解率、F1値、適合率、再現率