M

My Awesome Mind Model

Krithika-pによって開発
facebook/wav2vec2-baseをファインチューニングしたオーディオ分類モデルで、評価データセットで58.92%の精度を達成
ダウンロード数 15
リリース時間 : 12/9/2023

モデル概要

これはオーディオ分類タスク用のファインチューニングモデルで、wav2vec2アーキテクチャに基づいており、音声イベント検出などのシナリオに適しています

モデル特徴

wav2vec2アーキテクチャに基づく
Facebookがオープンソースで公開しているwav2vec2-baseモデルをベースアーキテクチャとして採用し、優れた音声特徴抽出能力を有しています
ファインチューニング最適化
50エポックにわたる精密なチューニングにより、ターゲットデータセットで分類性能を向上させました

モデル能力

オーディオ分類
音声イベント検出

使用事例

音声認識
環境音分類
環境中の様々な音のタイプを識別・分類します
テストデータセットで58.92%の精度を達成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase