Wav2vec2 Ser English Finetuned
該模型基於Wav2Vec2架構微調訓練,專門用於識別英語語音中的六種情緒狀態(悲傷、憤怒、厭惡、恐懼、快樂、中性),準確率達92.42%。
音頻分類
Safetensors 英語
W
dihuzz
68
1
My Awesome Mind Model
Apache-2.0
基於facebook/wav2vec2-base模型在minds14數據集上微調的音頻分類模型
音頻分類
Transformers

M
Gyaneshere
4
0
Finvoc2vec
專為企業披露場景設計的語音語調分類器,基於Wav2Vec2架構進行兩階段訓練
音頻分類
Transformers 英語

F
waiv
17
1
Voiceguard
MIT
基於Wav2Vec2微調的音頻分類器,能夠區分真人語音和AI生成語音。
音頻分類
Transformers 英語

V
Mrkomiljon
127
1
Music Classifier
基於Wav2Vec2的音頻分類模型,用於識別音樂流派
音頻分類
Safetensors
M
gastonduault
478
2
Baby Cry Classification Finetuned Babycry V4
Apache-2.0
基於wav2vec2-large-xlsr-53-english微調的嬰兒哭聲分類模型,準確率達81.5%
音頻分類
Transformers

B
Wiam
120
2
Speech Emotion Recognition With Facebook Wav2vec2 Large Xlsr 53
Apache-2.0
基於Wav2Vec2 Large XLSR-53模型微調的語音情感識別系統,能夠識別7種常見情感
音頻分類
Transformers

S
firdhokk
66
0
Wav2vec2 Xlsr English Speech Emotion Recognition
該模型用於從英語音頻中識別六種基本情緒:憤怒、厭惡、恐懼、快樂、悲傷和驚訝,基於RAVDESS數據集訓練。
音頻分類
Transformers 英語

W
AreejB
82
0
Wav2vec2 Large Robust 6 Ft Age Gender
該模型通過微調Wav2Vec2-Large-Robust,能夠從原始音頻中預測說話者的年齡和性別。
音頻分類
Transformers

W
audeering
19.29k
2
Arabic Speech Syllables Recognition Using Wav2vec2
這是一個基於wav2vec2的阿拉伯語音節識別模型,能夠從語音中識別現代標準阿拉伯語的音節。
語音識別
Transformers 阿拉伯語

A
IbrahimSalah
78
1
Englishmodel
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-300m微調的語音識別模型,主要用於英語語音轉文本任務。
語音識別
Transformers

E
Foxasdf
24
1
Wav2vec2 Ljspeech Gruut
Apache-2.0
基於Wav2Vec2架構的音素識別模型,在LJSpeech Phonemes數據集上微調,用於將語音轉換為音素序列
語音識別
Transformers 英語

W
bookbot
2,484
17
Wav2vec2 Xls R 300m En Atc Uwb Atcc And Atcosim
Apache-2.0
基於wav2vec2-xls-r-300m微調的航空管制通信語音識別模型,支持英語
語音識別
Transformers 英語

W
Jzuluaga
37
7
Wav2vec English Speech Emotion Recognition
Apache-2.0
基於Wav2Vec 2.0微調的英語語音情感識別模型,能夠識別7種不同情感
音頻分類
Transformers

W
r-f
139.06k
19
Malaya Speech Fine Tune Realcase 30 Jun Lm
該模型是在uob_singlish數據集上對malay-huggingface/wav2vec2-xls-r-300m-mixed進行微調的版本,主要用於語音識別任務。
語音識別
Transformers

M
RuiqianLi
71
0
Trained French
Apache-2.0
這是一個基於facebook/wav2vec2-base-960h微調的法語語音識別模型,在評估集上取得了1.0的詞錯誤率。
語音識別
Transformers

T
eugenetanjc
151
0
Malaya Speech Fine Tune Realcase 22 Jun
該模型是基於wav2vec2-xls-r-300m-mixed在新加坡英語(uob_singlish)數據集上微調的語音識別模型
語音識別
Transformers

M
RuiqianLi
20
0
Project NLP
Apache-2.0
基於facebook/wav2vec2-base微調的語音識別模型,在評估集上取得了0.3355的詞錯誤率(WER)。
語音識別
Transformers

P
zakria
22
0
Model Facebookptbrlarge
Apache-2.0
基於Facebook wav2vec2-large-xlsr-53-portuguese模型在common_voice數據集上微調的巴西葡萄牙語語音識別模型
語音識別
Transformers

M
Vkt
22
0
Wav2vec2 Base Common Voice 50p Persian Colab
Apache-2.0
該模型是基於facebook/wav2vec2-base在波斯語數據集上微調的語音識別模型,支持波斯語語音轉文本任務。
語音識別
Transformers

W
zoha
21
0
Wav2vec2 Xls R 300m Mr Cv9 With Lm
Apache-2.0
基於Facebook XLS-R-300M模型在馬拉地語語音數據集上微調的自動語音識別模型
語音識別
Transformers 其他

W
anuragshas
23
0
Wav2vec2 Xls R 300m Timit Phoneme
Apache-2.0
這是一個基於facebook/wav2vec2-xls-r-300m模型在TIMIT數據集上微調的自動音素識別模型,主要用於英語語音的音素級別識別。
語音識別
Transformers 英語

W
vitouphy
8,457
29
English Filipino Wav2vec2 L Xls R Test 09
Apache-2.0
基於jonatasgrosman/wav2vec2-large-xlsr-53-english微調的英語-菲律賓語語音識別模型,在評估集上WER為0.5750
語音識別
Transformers

E
Khalsuu
29.03k
1
English Filipino Wav2vec2 L Xls R Test 06
Apache-2.0
該模型是基於jonatasgrosman/wav2vec2-large-xlsr-53-english在filipino_voice數據集上微調的版本,用於英語和菲律賓語的語音識別任務。
語音識別
Transformers

E
Khalsuu
24
0
Wav2vec2 Base Timit Demo Colab11
Apache-2.0
該模型是基於facebook/wav2vec2-base進行微調的語音識別模型,在TIMIT數據集上取得了0.4348的詞錯誤率。
語音識別
Transformers

W
sameearif88
18
0
SSL Harveen Chadda Fine Tuning
MIT
該模型是基於Harveenchadha/vakyansh-wav2vec2-hindi-him-4200在未知數據集上微調得到的語音識別模型,支持印地語,在評估集上取得了10.08%的詞錯誤率。
語音識別
Transformers

S
rajat99
30
0
Gram Vaani Harveen Chadda Fine Tuning
MIT
這是一個基於Harveenchadha/vakyansh-wav2vec2-hindi-him-4200微調的語音識別模型,支持印地語語音轉文本任務。
語音識別
Transformers

G
nnair25
30
0
Wav2vec2 Large Robust 12 Ft Emotion Msp Dim
該模型通過對Wav2Vec2-Large-Robust進行微調訓練,用於語音情感識別,輸出喚醒度、支配度和效價三個維度的預測值。
音頻分類
Transformers 英語

W
audeering
394.51k
109
Output
Apache-2.0
基於facebook/wav2vec2-xls-r-300m在Mozilla Common Voice葡萄牙語數據集上微調的自動語音識別模型
語音識別
Transformers 其他

O
tonyalves
28
0
Wav2vec2 Large Xlsr 53 Coraa Brazilian Portuguese Gain Normalization
Apache-2.0
這是一個針對葡萄牙語進行微調的Wav2vec 2.0模型,訓練數據來源於多個葡萄牙語語音數據集,包括CORAA、CETUC、MLS等。
語音識別
Transformers 其他

W
alefiury
28
0
Finetune Indian Asr
基於Harveenchadha/vakyansh-wav2vec2-indian-english-enm-700微調的印度英語語音識別模型
語音識別
Transformers

F
Simply-divine
20
1
Wav2vec2 Xls R 300m Lm Hebrew
Apache-2.0
基於facebook/wav2vec2-xls-r-300m微調的希伯來語語音識別模型,添加了n-gram語言模型增強
語音識別
Transformers 其他

W
imvladikon
21
1
Bp Cetuc100 Xlsr
Apache-2.0
基於CETUC數據集針對巴西葡萄牙語進行微調的Wav2vec2模型,使用約145小時巴西葡萄牙語語音數據訓練
語音識別
Transformers 其他

B
lgris
22
0
Wav2vec2 Large Xls R 300m Ha Cv8
Apache-2.0
基於facebook/wav2vec2-xls-r-300m在通用語音數據集上微調的豪薩語語音識別模型
語音識別
Transformers 其他

W
anuragshas
17
1
Wav2vec2 Xlsr Punjabi
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53模型,使用通用語音數據集對旁遮普語進行微調的自動語音識別模型
語音識別
W
gagan3012
2,433
0
Wav2vec2 Base Timit Asr
Apache-2.0
基於facebook/wav2vec2-base在timit_asr數據集上微調的語音識別模型,支持16kHz採樣率的語音輸入
語音識別
Transformers 英語

W
elgeish
174
0
Xls R Spanish Test
Apache-2.0
這是一個基於facebook/wav2vec2-large-xlsr-53模型在西班牙語Common Voice 7數據集上微調的自動語音識別(ASR)模型。
語音識別
Transformers 西班牙語

X
pablouribe
29
0
German Trained
Apache-2.0
該模型是基於flozi00/wav2vec-xlsr-german微調的德語語音識別模型,主要用於德語語音轉文本任務。
語音識別
Transformers

G
chaitanya97
24
0
Wav2vec2 Large Xlsr 53 Telugu
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53模型微調的泰盧固語語音識別模型,使用OpenSLR SLR66數據集訓練
語音識別 其他
W
anuragshas
44.24k
5
Wav2vec2 Large Xlsr 53 Turkish
Apache-2.0
這是一個基於Facebook的wav2vec2-large-xlsr-53模型在土耳其語Common Voice數據集上微調的自動語音識別(ASR)模型。
語音識別 其他
W
ceyda
54
1
- 1
- 2
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98