audio_class-finetunedオープンソースオーディオ分類モデル - オーディオを正確に分類し、無料でデプロイしてすぐに使えます

ホーム

Audio Class Finetuned

Chemsseddineによって開発

このモデルはfacebook/wav2vec2-baseをsuperbデータセットでファインチューニングしたオーディオ分類モデルで、評価セットで0.6578の精度を達成しました。

音声分類

Transformers

オープンソースライセンス:Apache-2.0 #オーディオ分類 #wav2vec2ファインチューニング #低リソーストレーニング

ダウンロード数 20

リリース時間 : 4/16/2023

モデル概要

これはwav2vec2アーキテクチャに基づくオーディオ分類用のファインチューニングモデルで、音声関連の分類タスクに適しています。

モデル特徴

wav2vec2アーキテクチャベース

facebookのwav2vec2-baseモデルを基本アーキテクチャとして採用し、優れたオーディオ特徴抽出能力を有しています。

superbデータセットでファインチューニング

superbオーディオデータセットでファインチューニングされており、様々なオーディオ分類タスクに適用可能です。

中程度の精度

評価セットで0.6578の精度を達成しており、一般的なオーディオ分類アプリケーションに適しています。

モデル能力

オーディオ分類

音声特徴抽出

使用事例

音声処理

音声感情認識

音声中の感情状態を識別するために使用可能

音声コマンド分類

音声コマンドの識別と分類に使用可能

学習損失	エポック	ステップ	検証損失	正解率
1.1477	1.0	399	1.1623	0.6578

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Audio Class Finetuned

モデル概要

モデル特徴

モデル能力

使用事例

🚀 audio_class-finetuned

📚 ドキュメント

モデルの説明

想定される用途と制限事項

学習と評価データ

学習手順

学習ハイパーパラメータ

学習結果

フレームワークのバージョン

📄 ライセンス