W

Whisper Base Finetuned Gtzan

vineetsharmaによって開発
OpenAIのwhisper-baseモデルをGTZANデータセットでファインチューニングした音声分類モデルで、主に音楽ジャンル分類タスクに使用されます。
ダウンロード数 15
リリース時間 : 7/3/2023

モデル概要

このモデルはwhisper-baseアーキテクチャのバリアントで、音楽ジャンル分類タスクに特化して最適化されています。GTZANデータセットで87%の精度を達成しました。

モデル特徴

高精度
GTZANテストセットで87%の分類精度を達成
ファインチューニング最適化
whisper-baseモデルを音楽分類タスク向けに特別に最適化
軽量
whisper-baseアーキテクチャベースで比較的軽量(推論)

モデル能力

音楽ジャンル分類
音声特徴抽出

使用事例

音楽分析
音楽ジャンル自動分類
音楽クリップをジャンル分類
精度87%
音楽推薦システム
音楽推薦システムの前処理コンポーネントとして
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase