whisper-tiny-finetuned-gtzanオープンソース音声分類モデル - 無料でデプロイ可能、精度は91%に達する

Whisper Tiny Finetuned Gtzan

vineetsharmaによって開発

openai/whisper-tinyをGTZANデータセットでファインチューニングした音声分類モデル、精度91%達成

ダウンロード数 17

リリース時間 : 7/2/2023

モデル概要

このモデルはWhisper-tinyアーキテクチャのファインチューン版で、音楽ジャンル分類タスク専用に設計されており、GTZANデータセットで優れた性能を発揮します。

高精度

GTZANテストセットで91%の分類精度を達成

軽量

whisper-tinyアーキテクチャベースでパラメータ規模が小さく、リソース制約環境に適している

高速収束

わずか10エポックのトレーニングで最高性能に到達

音楽ジャンル分類

オーディオ特徴量抽出

音楽分析

自動音楽分類

音楽クリップをジャンル別に自動分類

10種類の音楽ジャンルを正確に識別

音楽推薦システム

音楽推薦システムの前処理分類モジュールとして利用

プロパティ	詳細
モデルタイプ	ファインチューニングされたwhisper-tinyモデル
学習データ	marsyas/gtzanデータセット
評価指標	精度
ベースモデル	openai/whisper-tiny