N

Neunit Ks Kangyuan0601

SHENMU007によって開発
このモデルはfacebook/wav2vec2-baseをsuperbデータセットでファインチューニングした音声分類モデルで、評価セットで99.87%の精度を達成しました。
ダウンロード数 16
リリース時間 : 6/1/2023

モデル概要

wav2vec2アーキテクチャに基づく音声分類タスク用のファインチューニングモデルで、音声関連の分類タスクに適しています。

モデル特徴

高精度
評価セットで99.87%の高精度を達成
wav2vec2アーキテクチャ採用
facebookのwav2vec2-baseをベースモデルとして使用
効率的なトレーニング
混合精度トレーニングや勾配蓄積などの技術でトレーニングプロセスを最適化

モデル能力

音声分類
音声特徴抽出

使用事例

音声処理
音声コマンド分類
音声コマンドの識別と分類に使用可能
高精度識別
音声感情分析
音声中の感情特徴を分析するために使用可能
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase