W

Wav2vec2 Base Music Speech Both Classification

FerhatDkによって開発
facebook/wav2vec2-baseをファインチューニングしたオーディオ分類モデルで、音楽と音声を区別するために使用されます
ダウンロード数 20
リリース時間 : 7/10/2023

モデル概要

このモデルはwav2vec2-baseアーキテクチャをファインチューニングしたオーディオ分類器で、音楽と音声の2種類のオーディオコンテンツを区別するために特別に設計されています。評価セットで98.47%の精度を達成しました。

モデル特徴

高精度
評価セットで98.47%の分類精度を達成
wav2vec2アーキテクチャベース
wav2vec2-base事前学習モデルをファインチューニングし、優れたオーディオ特徴抽出能力を有する
軽量トレーニング
わずか8トレーニングエポックで高性能を達成

モデル能力

オーディオ分類
音楽認識
音声認識

使用事例

オーディオコンテンツ分析
音楽/音声自動分類
オーディオコンテンツが音楽か音声かを自動識別
精度98.47%
メディア管理
オーディオライブラリ自動分類
オーディオライブラリのコンテンツに自動的に音楽/音声タグを追加
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase