A

Ast Finetuned Audioset 10 10 0.4593 Finetuning ESC 50

xpariz10によって開発
このモデルはASTアーキテクチャに基づきAudioSetデータセットで事前学習され、ESC-50データセットでファインチューニングされたオーディオ分類モデルで、評価セットで94.64%の精度を達成しました。
ダウンロード数 24
リリース時間 : 12/7/2022

モデル概要

オーディオ分類のための深層学習モデルで、特に環境音分類タスクに適しています。

モデル特徴

高精度
ESC-50評価セットで94.64%の分類精度を達成
Transformerアーキテクチャベース
AST(Audio Spectrogram Transformer)アーキテクチャを採用してオーディオデータを処理
転移学習
最初にAudioSetデータセットで事前学習し、その後ESC-50でファインチューニング

モデル能力

環境音分類
オーディオ特徴抽出
音響イベント検出

使用事例

環境モニタリング
都市音分類
都市環境における様々な音を識別・分類
交通、建築、自然など多様な環境音を正確に識別可能
スマートホーム
家庭内異常音検出
ガラス破損、警報音などの家庭環境における異常音を検出
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase