GenreVim-Music-Detection-DistilHuBERTオープンソースオーディオ分類モデル - 音楽と非音楽オーディオを精度よく区別する

ホーム

Genrevim Music Detection DistilHuBERT

MarekCechによって開発

このモデルはDistilHuBERTをファインチューニングしたオーディオ分類モデルで、音楽と非音楽オーディオを区別するために特別に設計されています。

音声分類

Transformers

#音楽検出 #オーディオ分類 #軽量モデル

ダウンロード数 61

リリース時間 : 7/3/2024

モデル概要

これはファインチューニングされたオーディオ分類モデルで、主に音楽検出タスクに使用され、オーディオクリップに音楽コンテンツが含まれているかどうかを正確に識別できます。

モデル特徴

効率的な音楽検出

音楽と非音楽オーディオクリップを区別するために特別に最適化されており、高い精度を備えています。

DistilHuBERTベース

軽量なDistilHuBERTアーキテクチャをベースにしており、性能を維持しながら計算リソースの需要を削減します。

精密調整パラメータ

学習率5e-5、Adamオプティマイザーなど、慎重に選択されたハイパーパラメータを使用してトレーニングされています。

モデル能力

オーディオ分類

音楽検出

オーディオコンテンツ分析

使用事例

オーディオコンテンツ管理

音楽コンテンツフィルタリング

オーディオファイル内の音楽コンテンツを自動的に識別・分類

音楽と非音楽クリップを正確に区別

メディア処理

自動オーディオタグ付け

オーディオファイルに自動的に音楽/非音楽タグを追加

オーディオライブラリ管理の効率向上

プロパティ	詳細
評価指標	正解率 (accuracy)
パイプラインタグ	オーディオ分類 (audio-classification)
タグ	音楽 (music)

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Genrevim Music Detection DistilHuBERT

モデル概要

モデル特徴

モデル能力

使用事例

🚀 音楽検出用オーディオ分類モデル

📚 ドキュメント

メトリクス

学習ハイパーパラメータ