Deepfake Audio Detection V1
Apache-2.0
基於wav2vec2-base微調的深度偽造音頻檢測模型,準確率達99.66%
音頻分類
Transformers

D
Zeyadd-Mostaffa
33
0
Wav2vec2 Base 100k Gtzan Music Genres Finetuned Wav2vec2 Ivan
基於wav2vec2架構的音樂流派分類模型,在GTZAN數據集上微調,準確率達98%
音頻分類
Transformers

W
itmanov
32
1
Wav2vec2 Large Xlsr 53 Serbian Smart Home Commands
MIT
基於wav2vec2的塞爾維亞語智能家居語音指令識別模型,可識別7種控制指令
音頻分類 其他
W
mradovic38
320
0
Wav2 Noise
Apache-2.0
基於facebook/wav2vec2-base微調的噪聲識別模型,準確率達93.89%
音頻分類
Transformers

W
zylin12
1
0
My Awesome Mind Model
Apache-2.0
基於facebook/wav2vec2-base在minds14數據集上微調的音頻分類模型
音頻分類
Transformers

M
faaany
1
0
Wav2vec2 Large Xlsr 53 Th Speech Emotion Recognition 3c
基於airesearch/wav2vec2-large-xlsr-53-th微調的泰語語音情感識別模型,支持憤怒、快樂、平靜三種情感分類
音頻分類
Transformers

W
Paranchai
9
0
Wav2vec2 Turkish Gender Classification
Apache-2.0
基於facebook/wav2vec2-base微調的土耳其語性別分類模型,在common_voice_17_0數據集上訓練,測試集準確率達84.79%
音頻分類
Transformers

W
candenizkocak
19
1
W2v Speech Emotion Recognition
MIT
基於Wav2Vec2架構微調的英語語音情感識別模型,可識別六種情感狀態
音頻分類 英語
W
Khoa
147
0
Wav2vec2 ASV Deepfake Audio Detection
Apache-2.0
基於facebook/wav2vec2-base微調的深度偽造音頻檢測模型,用於識別合成或篡改的語音內容
說話人處理
Transformers

W
Bisher
106
1
Japanese Wav2vec2 Base Rs35kh
Apache-2.0
基於大規模日語自動語音識別語料庫ReazonSpeech v2.0微調的wav2vec 2.0 Base模型,適用於日語自動語音識別任務。
語音識別
Transformers 日語

J
reazon-research
3,968
1
Audio Emotion Detection
Apache-2.0
本模型是基於facebook/wav2vec2-large-xlsr-53微調而成的音頻情感檢測模型,可識別7種情感狀態
音頻分類
Transformers

A
Hatman
630
8
Wav2vec2 Large Xls R 300m Amharic Demo Colab
Apache-2.0
基於facebook/wav2vec2-xls-r-300m在common_voice_16_1數據集上微調的阿姆哈拉語語音識別模型
語音識別
Transformers

W
DipsankarSinha
18
2
Wav2vec2 Base ASVSpoof5 TUC N
Apache-2.0
基於wav2vec2-base微調的語音防偽檢測模型,在評估集上達到88.89%準確率
音頻分類
Transformers

W
DavidCombei
20
0
Wav2vec2 Large Lv60 Phoneme Timit English Timit 4k 002
Apache-2.0
基於facebook/wav2vec2-large-lv60在TIMIT數據集上微調的英語音素識別模型,音素錯誤率10.53%
語音識別
Transformers 英語

W
excalibur12
103
1
Wav2vec2 Large Lv60 Phoneme Timit English Timit 4k
Apache-2.0
基於facebook/wav2vec2-large-lv60微調的英語音素識別模型,在TIMIT數據集上取得10.53%的音素錯誤率
語音識別
Transformers 英語

W
excalibur12
306
3
Speechbrain Emotion Recognition Openvino
Apache-2.0
該模型使用微調的wav2vec2(基礎)架構,在IEMOCAP數據集上訓練,用於語音情感識別任務。
音頻分類 英語
S
psakamoori
13
0
Wav2vec2 Large Xlrs Korean V5
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-300m在zeroth_korean數據集上微調的韓語自動語音識別模型,詞錯誤率為0.2433。
語音識別
Transformers

W
student-47
285
1
Deepfake Audio Detection
Apache-2.0
基於facebook/wav2vec2-base微調的深度偽造音頻檢測模型,在評估集上準確率達95.45%
音頻分類
Transformers

D
Heem2
246
0
Wav2vec Base Crema Sentiment Analysis
Apache-2.0
基於facebook/wav2vec2-base微調的語音情感分析模型,在評估集上達到70.87%的準確率
音頻分類
Transformers

W
Piyush2512
38
0
Violence Detect 44
Apache-2.0
基於facebook/wav2vec2-base-960h微調的音頻分類模型,用於檢測暴力聲音
音頻分類
Transformers

V
Hemg
28
0
Deeepfake Audio Recognition Ttoo
Apache-2.0
基於facebook/wav2vec2-base微調的深度偽造音頻識別模型,在評估集上準確率達95.45%
音頻分類
Transformers

D
Hemg
20
0
Wav2vec2 Base Arabic Speech Emotion Recognition
Apache-2.0
基於facebook/wav2vec2-base微調的阿拉伯語語音情感識別模型,在評估集上取得了99.92%的準確率。
音頻分類
Transformers

W
ahmmedasaad2772
352
0
Wav2vec2 Base Gender Classification
Apache-2.0
基於facebook/wav2vec2-base微調的語音性別分類模型,在評估集上準確率達98.92%
音頻分類
Transformers

W
7wolf
14
1
Wav2vec2 Large Xlsr 53 English Finetuned Ravdess
Apache-2.0
基於wav2vec2-large-xlsr-53-english模型在RAVDESS數據集上微調的語音情感識別模型
音頻分類
Transformers

W
firdho26
68
0
My Awesome Mind Model
Apache-2.0
基於facebook/wav2vec2-base微調的音頻分類模型,在評估集上達到58.92%的準確率
音頻分類
Transformers

M
Krithika-p
15
0
Wav2vec2 Audio Emotion Classification
Apache-2.0
基於facebook/wav2vec2-base微調的音頻情感分類模型,在評估集上準確率達73.98%
音頻分類
Transformers

W
chin-may
77
5
Wav2vec2 Base Music Speech Both Classification Finetuned Gtzan
Apache-2.0
基於wav2vec2架構的音頻分類模型,在GTZAN數據集上微調,用於音樂和語音分類任務
音頻分類
Transformers

W
0bi0n3
15
1
Wav2vec2 Large Robust 24 Ft Age Gender
該模型以原始音頻信號作為輸入,輸出年齡預測值以及性別概率(兒童/女性/男性),同時輸出最後一層transformer的池化狀態。
音頻分類
Transformers

W
audeering
44.13k
33
Wav2vec Fine Tuned Speech Command2
Apache-2.0
基於facebook/wav2vec2-base在speech_commands數據集上微調的語音識別模型,準確率達97.35%
音頻分類
Transformers

W
Thamer
16
0
Viet Tones Model
基於wav2vec2-base-vietnamese-250h微調的越南語聲調識別模型,準確率59.72%
語音識別
Transformers

V
StevenLe456
22
0
Asr Wav2vec2 Commonvoice 14 Zh CN
Apache-2.0
這是一個基於CommonVoice中文數據集訓練的端到端自動語音識別系統,使用wav2vec2.0和CTC架構,支持中文語音識別。
語音識別 中文
A
speechbrain
36
9
Asr Wav2vec2 Commonvoice 14 Es
Apache-2.0
這是一個基於CommonVoice西班牙語數據集訓練的端到端自動語音識別系統,使用wav2vec 2.0預訓練模型結合CTC解碼器。
語音識別 西班牙語
A
speechbrain
22
3
Wav2vec2 Base Finetuned Gtzan
Apache-2.0
該模型是基於facebook/wav2vec2-base在GTZAN數據集上微調的音頻分類模型,主要用於音樂流派分類任務。
音頻分類
Transformers

W
wilson-wei
14
0
Wav2vec2 Base Down On
Apache-2.0
基於facebook/wav2vec2-base微調的二進制音頻分類模型,專門用於區分'down'和'on'的發音
音頻分類
Transformers

W
MatsRooth
20
0
Wav2vec2 Base Music Speech Both Classification
Apache-2.0
基於facebook/wav2vec2-base微調的音頻分類模型,用於區分音樂和語音
音頻分類
Transformers

W
FerhatDk
20
0
Wav2vec2 Nepali
基於Facebook的wav2vec2模型微調的尼泊爾語語音識別模型
語音識別
Transformers 其他

W
anish-shilpakar
312
1
Neunit Nihaochangchu V3
Apache-2.0
基於facebook/wav2vec2-base微調的音頻分類模型,在superb數據集上訓練,準確率達99.99%
音頻分類
Transformers

N
SHENMU007
14
0
Bsc Ai Thesis Torgo Model 1
Apache-2.0
基於facebook/wav2vec2-base微調的語音處理模型,在評估集上表現出色
語音識別
Transformers

B
Juardo
19
0
SER Wav2vec2 Large Xlsr 53 Eng Zho Adults
基於wav2vec2-large-xlsr-53微調的跨語言跨年齡組語音情感識別模型,支持英語和中文
音頻分類
Transformers 支持多種語言

S
CAiRE
32
0
Wav2musicgenre
Apache-2.0
基於facebook/wav2vec2-base微調的音頻分類模型,用於識別音樂流派
音頻分類
Transformers

W
ramonpzg
20
0
- 1
- 2
- 3
- 4
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98