wav2vec2-base-960h-finetuned-deepfakeモデル - 無料オープンソースで音声ディープフェイクの高精度検出を支援

ホーム

Wav2vec2 Base 960h Finetuned Deepfake

HyperMoonによって開発

facebook/wav2vec2-base-960hをasvspoof2019データセットでファインチューニングした音声ディープフェイク検出モデル

音声分類

Transformers

オープンソースライセンス:Apache-2.0 #音声偽造検出 #高精度認識 #ASVspoof2019

ダウンロード数 49

リリース時間 : 9/18/2022

モデル概要

このモデルは音声に含まれるディープフェイクコンテンツを検出するために特別に設計されており、asvspoof2019評価セットで99.98%の精度を達成しています。

モデル特徴

高精度

asvspoof2019評価セットで99.98%の精度を達成

wav2vec2アーキテクチャベース

強力なwav2vec2-base-960hモデルをファインチューニング

専門的音声偽造検出

音声ディープフェイクコンテンツに特化して最適化

モデル能力

音声偽造検出

音声分析

使用事例

セキュリティ検出

音声認証システム

音声認証システムにおける偽造音声を検出

99.98%の偽造音声を効果的に識別可能

コンテンツモデレーション

ソーシャルメディアコンテンツ審査

ソーシャルメディアプラットフォーム上のディープフェイク音声コンテンツを検出

トレーニング損失	エポック	ステップ	検証損失	正解率
0.0027	1.0	793	0.0070	0.9990
0.0006	2.0	1586	0.0032	0.9995
0.0271	3.0	2379	0.0022	0.9995
0.0002	4.0	3172	0.0009	0.9998
0.0002	5.0	3965	0.0020	0.9998

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Wav2vec2 Base 960h Finetuned Deepfake

モデル概要

モデル特徴

モデル能力

使用事例

🚀 wav2vec2-base-960h-finetuned-deepfake

📚 ドキュメント

🔧 技術詳細

トレーニングのハイパーパラメータ

トレーニング結果

フレームワークのバージョン

📄 ライセンス