# 高精度オーディオ分類

Wav2vec2 Vd Bird Sound Classification
MIT
wav2vec2-baseでトレーニングされた鳥類音声分類モデル。インドのVedanthangal鳥類保護区の21種の鳥類を識別可能
音声分類 Transformers 英語
W
greenarcade
133
1
Voiceguard
MIT
Wav2Vec2をファインチューニングしたオーディオ分類器で、実在人物の音声とAI生成音声を区別できます。
音声分類 Transformers 英語
V
Mrkomiljon
127
1
Wavlm Large Finetuned SER
WavLM-Largeベースの音声感情認識モデルで、英語音声の感情分類をサポートします。
音声分類 英語
W
JBJoyce
139
0
Distilhubert Finetuned Cry Detector
Apache-2.0
distilhubertアーキテクチャを微調整した泣き声検出モデルで、評価データセットで優れた性能を示し、精度は98.83%に達しました
音声分類 Transformers
D
Marcos12886
22
1
Urdu Emotions Whisper Medium
Apache-2.0
Whisper-mediumをファインチューニングしたウルドゥー語感情認識モデル、評価セットで91.67%の精度を達成
音声分類 Transformers
U
Pak-Speech-Processing
43
0
Wav2vec2 Large Xlsr 53 English Finetuned Ravdess
Apache-2.0
wav2vec2-large-xlsr-53-englishモデルをRAVDESSデータセットでファインチューニングした音声感情認識モデル
音声分類 Transformers
W
firdho26
68
0
AST ASVspoof2019 Synthetic Voice Detection
MIT
このモデルはMIT/ast-finetuned-audioset-10-10-0.4593を微調整したバージョンで、合成音声を検出するために使用されます。
音声分類 Transformers 英語
A
MattyB95
18
1
Wav2vec2 Animal Sounds Finetuned Hubert Finetuned Animals
Apache-2.0
HuBERTアーキテクチャを基にファインチューニングした動物音声分類モデル。10種類の動物の鳴き声を認識可能で、精度は95%
音声分類 Transformers
W
ardneebwar
555
7
Whisper Tiny Bn Emo
shhossain/whisper-tiny-bnをファインチューニングした感情分類モデルで、ベンガル語の7つの基本感情を認識可能
音声分類 Transformers その他
W
shhossain
20
1
Speechcommand Demo
Apache-2.0
facebook/wav2vec2-baseをファインチューニングした音声コマンド分類モデル、superbデータセットでトレーニングされ、精度98.09%を達成
音声分類 Transformers
S
SHENMU007
18
0
Internal.wav2vec2 Base Superb Ks Int8 Structured79
Apache-2.0
このモデルはwav2vec2-base-ft-keyword-spottingをsuperbデータセットでファインチューニングしたバージョンで、オーディオ分類タスク用に量子化と構造化プルーニング最適化が施されています。
音声分類 Transformers
I
yujiepan
16
0
Trillsson3 Ft Keyword Spotting
TRillsson3アーキテクチャに基づくオーディオ分類モデル、superbデータセットでファインチューニングされ、キーワード認識タスクに使用
音声分類 Transformers
T
vumichien
30
0
Trillsson3 Ft Keyword Spotting 13
TRillsson3アーキテクチャに基づくオーディオ分類モデル、superbデータセットでファインチューニングされ、キーワード認識タスク用
音声分類 Transformers
T
vumichien
32
0
Trillsson3 Ft Keyword Spotting 12
TRillsson3アーキテクチャに基づくオーディオ分類モデルで、キーワード検出タスクに微調整され、評価セットで91.5%の精度を達成しました。
音声分類 Transformers
T
vumichien
32
1
Urdu Audio Emotions
Apache-2.0
facebook/wav2vec2-large-xlsr-53をファインチューニングしたウルドゥー語オーディオ感情分類モデル。怒り、喜び、平静、悲しみの4つの感情認識をサポート
音声分類 Transformers
U
Talha
66
15
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase