T

Testv4

anderlohによって開発
wav2vec事前学習モデルをsuperbデータセットでファインチューニングした5分類音声分類モデル
ダウンロード数 27
リリース時間 : 6/20/2024

モデル概要

このモデルはwav2vec事前学習モデルをsuperbデータセットでファインチューニングしたバージョンで、主に音声分類タスクに使用され、検証セットで62.09%の精度を達成

モデル特徴

wav2vec事前学習ベース
wav2vecの強力な音声表現能力を活用した転移学習
5分類音声認識
音声データを5つの異なるカテゴリに分類可能
中程度の精度
検証セットで62.09%の精度を達成

モデル能力

音声分類
音声特徴抽出

使用事例

音声分析
音声感情認識
音声中の感情カテゴリを識別
精度62.09%
音声コマンド分類
音声コマンドを分類処理
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase