W

Wav2vec2 Base Finetuned Ks

motheecreatorによって開発
wav2vec2-baseモデルをオーディオフォルダデータセットでファインチューニングしたオーディオ分類モデルで、検証セットの精度は99.82%
ダウンロード数 54
リリース時間 : 4/16/2024

モデル概要

このモデルはwav2vec2-baseアーキテクチャのファインチューニング版で、オーディオ分類タスク専用です。評価セットで非常に高い精度(99.82%)を示し、高精度なオーディオ分類が必要なアプリケーションに適しています。

モデル特徴

高精度
検証セットで99.82%の分類精度を達成
wav2vec2アーキテクチャ採用
実績のあるwav2vec2-baseアーキテクチャをベースモデルとして採用
効率的なファインチューニング
わずか5エポックのトレーニングで高性能を実現

モデル能力

オーディオ分類
音声特徴抽出

使用事例

音声認識
キーワード認識
オーディオ中の特定のキーワードやフレーズを識別
高精度なキーワード検出
オーディオ分析
オーディオイベント検出
オーディオ中の特定のイベントや音を検出・分類
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase