Wav2vec2 Vd Bird Sound Classification
MIT
wav2vec2-baseでトレーニングされた鳥類音声分類モデル。インドのVedanthangal鳥類保護区の21種の鳥類を識別可能
音声分類
Transformers 英語

W
greenarcade
133
1
Voiceguard
MIT
Wav2Vec2をファインチューニングしたオーディオ分類器で、実在人物の音声とAI生成音声を区別できます。
音声分類
Transformers 英語

V
Mrkomiljon
127
1
Wavlm Large Finetuned SER
WavLM-Largeベースの音声感情認識モデルで、英語音声の感情分類をサポートします。
音声分類 英語
W
JBJoyce
139
0
Distilhubert Finetuned Cry Detector
Apache-2.0
distilhubertアーキテクチャを微調整した泣き声検出モデルで、評価データセットで優れた性能を示し、精度は98.83%に達しました
音声分類
Transformers

D
Marcos12886
22
1
Urdu Emotions Whisper Medium
Apache-2.0
Whisper-mediumをファインチューニングしたウルドゥー語感情認識モデル、評価セットで91.67%の精度を達成
音声分類
Transformers

U
Pak-Speech-Processing
43
0
Wav2vec2 Large Xlsr 53 English Finetuned Ravdess
Apache-2.0
wav2vec2-large-xlsr-53-englishモデルをRAVDESSデータセットでファインチューニングした音声感情認識モデル
音声分類
Transformers

W
firdho26
68
0
AST ASVspoof2019 Synthetic Voice Detection
MIT
このモデルはMIT/ast-finetuned-audioset-10-10-0.4593を微調整したバージョンで、合成音声を検出するために使用されます。
音声分類
Transformers 英語

A
MattyB95
18
1
Wav2vec2 Animal Sounds Finetuned Hubert Finetuned Animals
Apache-2.0
HuBERTアーキテクチャを基にファインチューニングした動物音声分類モデル。10種類の動物の鳴き声を認識可能で、精度は95%
音声分類
Transformers

W
ardneebwar
555
7
Whisper Tiny Bn Emo
shhossain/whisper-tiny-bnをファインチューニングした感情分類モデルで、ベンガル語の7つの基本感情を認識可能
音声分類
Transformers その他

W
shhossain
20
1
Speechcommand Demo
Apache-2.0
facebook/wav2vec2-baseをファインチューニングした音声コマンド分類モデル、superbデータセットでトレーニングされ、精度98.09%を達成
音声分類
Transformers

S
SHENMU007
18
0
Internal.wav2vec2 Base Superb Ks Int8 Structured79
Apache-2.0
このモデルはwav2vec2-base-ft-keyword-spottingをsuperbデータセットでファインチューニングしたバージョンで、オーディオ分類タスク用に量子化と構造化プルーニング最適化が施されています。
音声分類
Transformers

I
yujiepan
16
0
Trillsson3 Ft Keyword Spotting
TRillsson3アーキテクチャに基づくオーディオ分類モデル、superbデータセットでファインチューニングされ、キーワード認識タスクに使用
音声分類
Transformers

T
vumichien
30
0
Trillsson3 Ft Keyword Spotting 13
TRillsson3アーキテクチャに基づくオーディオ分類モデル、superbデータセットでファインチューニングされ、キーワード認識タスク用
音声分類
Transformers

T
vumichien
32
0
Trillsson3 Ft Keyword Spotting 12
TRillsson3アーキテクチャに基づくオーディオ分類モデルで、キーワード検出タスクに微調整され、評価セットで91.5%の精度を達成しました。
音声分類
Transformers

T
vumichien
32
1
Urdu Audio Emotions
Apache-2.0
facebook/wav2vec2-large-xlsr-53をファインチューニングしたウルドゥー語オーディオ感情分類モデル。怒り、喜び、平静、悲しみの4つの感情認識をサポート
音声分類
Transformers

U
Talha
66
15
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98