H

Hubert Large Audioset

ALMによって開発
HuBERTアーキテクチャに基づくTransformerモデルで、完全なAudioSetデータセットで事前学習されており、汎用オーディオ表現学習タスクに適しています。
ダウンロード数 79
リリース時間 : 8/28/2023

モデル概要

このモデルはHuBERTアーキテクチャに基づいており、多様なAudioSetデータセットで事前学習されており、さまざまなオーディオ処理タスクに適用可能な汎用オーディオ特徴を抽出できます。

モデル特徴

汎用オーディオ表現
多様なAudioSetデータセットで事前学習されており、さまざまなオーディオタイプ(音声、音楽、環境音など)を処理できます
HuBERTアーキテクチャベース
HuBERTの自己教師あり学習方法を採用し、オーディオ信号の時系列特徴を効果的に捕捉します
転移学習に適している
特徴抽出器として使用したり、下流タスクで微調整したりできます

モデル能力

オーディオ特徴抽出
音楽分類
音響イベント検出
音声認識(限定的な能力)

使用事例

音楽分析
音楽ジャンル分類
モデルが抽出した特徴を使用して音楽ジャンルを自動分類
環境音分析
音響イベント検出
環境中の特定の音響イベント(警報音、動物の鳴き声など)を検出
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase