V

Voiceguard

Mrkomiljonによって開発
Wav2Vec2をファインチューニングしたオーディオ分類器で、実在人物の音声とAI生成音声を区別できます。
ダウンロード数 127
リリース時間 : 12/2/2024

モデル概要

このモデルは音声がAI生成かどうかを検出するために使用され、様々なTTSモデルで生成された音声を識別可能で、音声セキュリティ検証シナリオに適しています。

モデル特徴

高精度分類
テストセットで99.8%の精度を達成し、実在人物音声と複数のAI生成音声を効果的に区別可能
多モデル互換
Melgan、DiffWaveなど様々なTTSモデルで生成された音声の識別をサポート
軽量デプロイ
Wav2Vec2-baseアーキテクチャを基にし、リアルタイム推論シナリオに適しています

モデル能力

オーディオ分類
AI生成音声検出
音声真正性検証

使用事例

セキュリティ検証
音声フィッシング防止
不審な電話におけるAI合成音声を検出
既知のTTSモデルで生成された音声の99%以上を識別可能
コンテンツモデレーション
偽造音声識別
ソーシャルメディア上のAI生成音声コンテンツを識別
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase