Wav2vec Checkpoints
Apache-2.0
基於facebook/wav2vec2-base微調的語音處理模型,在評估集上準確率達99.48%
語音識別
Transformers

W
Zeyadd-Mostaffa
19
0
Distilhubert Finetuned Gtzan 5 Epochs Finetuned Gtzan Finetuned Gtzan
基於DistilHuBERT架構的音頻分類模型,在GTZAN數據集上微調,用於音樂流派分類任務。
音頻分類
Transformers

D
duysal
5
0
Deepfake Audio Detection
Apache-2.0
基於wav2vec2-base-finetuned進一步微調的語音處理模型,在評估集上準確率達98.82%
語音識別
Transformers

D
motheecreator
1,468
7
Wav2vec2 Base Finetuned
Apache-2.0
基於facebook/wav2vec2-base模型微調的語音處理模型,在評估集上達到99.97%的準確率
語音識別
Transformers

W
mo-thecreator
19
4
Wav2vec2 Base Finetuned
Apache-2.0
基於facebook/wav2vec2-base模型微調的語音處理模型,在評估集上準確率達99.97%
語音識別
Transformers

W
motheecreator
105
4
Distilhubert Finetuned Chorddetection
Apache-2.0
基於distilhubert模型微調的和絃檢測模型,在ChordStimation數據集上訓練,評估準確率達到100%
音頻分類
Transformers

D
alejogil35
14
1
Karolgrv2
這是一個RVC(Retrieval-based Voice Conversion)模型,用於音頻到音頻的轉換任務。
語音合成
Transformers

K
sail-rvc
6
0
Vocoder Daft Punk RVC 200 Epochs
這是一個RVC(即時語音轉換)模型,經過200輪訓練,適用於語音轉換任務。
語音合成
Transformers

V
sail-rvc
1,304
0
Snoop
Snoop是一個基於RVC(Retrieval-based Voice Conversion)技術的音頻轉音頻模型,主要用於語音轉換任務。
語音合成
Transformers

S
sail-rvc
3,997
0
Ronaldo
這是一個基於RVC(Retrieval-based Voice Conversion)的語音轉換模型,可以將輸入音頻轉換為特定風格的語音。
語音合成
Transformers

R
sail-rvc
3,855
1
Drake RVC
Drake_RVC 是一個基於 RVC (Retrieval-based Voice Conversion) 技術的音頻轉音頻模型,專門用於語音轉換任務。
語音合成
Transformers

D
sail-rvc
5,043
1
Cardib2333333
這是一個基於RVC(Retrieval-based Voice Conversion)技術的語音轉換模型,能夠將輸入的音頻轉換為特定風格的語音輸出。
語音合成
Transformers

C
sail-rvc
807
1
CJ RVC V2 400 Epochs
這是一個基於RVC(Retrieval-based Voice Conversion)技術的語音轉換模型,經過400輪訓練,適用於音頻轉音頻任務。
語音合成
Transformers

C
sail-rvc
1,949
0
Andrewtate
這是一個基於RVC(Retrieval-based Voice Conversion)技術的語音轉換模型,可以將輸入音頻轉換為安德魯·泰特風格的聲音。
語音合成
Transformers

A
sail-rvc
910
3
Alvin
這是一個RVC(Retrieval-based Voice Conversion)模型,用於音頻到音頻的轉換任務。
語音合成
Transformers

A
sail-rvc
4,909
0
Audio Cls Unispeech Sat Base 100h Libri Ft Minds14 Finetune
Apache-2.0
基於microsoft/unispeech-sat-base-100h-libri-ft在minds14數據集上微調的語音分類模型
音頻分類
Transformers

A
jonastokoliu
21
0
Wav2vec2 Base Finetuned Amd
Apache-2.0
該模型是基於facebook/wav2vec2-base在未知數據集上微調的版本,主要用於語音識別任務,在評估集上達到84.55%的準確率。
語音識別
Transformers

W
justin1983
14
0
Whisper Small Ft Common Language Id
Apache-2.0
基於openai/whisper-small微調的通用語言識別模型,在評估集上準確率達88.6%
音頻分類
Transformers

W
sanchit-gandhi
256.20k
2
Wav2vec2 Base Finetuned Ie
Apache-2.0
基於facebook/wav2vec2-base模型微調的版本,用於特定任務
語音識別
Transformers

W
minoosh
14
0
Wav2vec2 Base Finetuned Ks
Apache-2.0
基於facebook/wav2vec2-base模型微調的語音識別模型,在評估集上準確率達到87.27%。
語音識別
Transformers

W
FerhatDk
38
0
Wav2vec2 Base Ft Cv3 V3
Apache-2.0
該模型是基於facebook/wav2vec2-base在Common Voice 3.0英語數據集上微調的語音識別模型,在測試集上取得了0.247的詞錯誤率。
語音識別
Transformers

W
danieleV9H
120
0
Wav2vec Trained
Apache-2.0
該模型是基於facebook/wav2vec2-base微調而成的語音識別模型,在評估集上取得了詞錯誤率0.1042的表現。
語音識別
Transformers

W
eugenetanjc
70
0
Resepformer Wsj02mix
Apache-2.0
這是一個基於RE-SepFormer架構的音頻源分離模型,由SpeechBrain實現並在WSJ0-2Mix數據集上訓練。
聲音分離 英語
R
speechbrain
488
3
Ai Light Dance Singing Ft Wav2vec2 Large Xlsr 53
Apache-2.0
該模型是基於facebook/wav2vec2-large-xlsr-53在AI_LIGHT_DANCE - ONSET-SINGING數據集上微調的自動語音識別模型,主要用於歌唱語音識別任務。
語音識別
Transformers

A
gary109
23
1
Wav2vec2 Base Vios Commonvoice 1
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-300m在Common Voice數據集上微調的語音識別模型,支持自動語音識別任務。
語音識別
Transformers

W
tclong
21
0
Wav2vec2 Final 1 Lm 3
Apache-2.0
基於facebook/wav2vec2-base微調的語音識別模型,在評估集上詞錯誤率為0.4499,使用4-Gram語言模型時可降至0.126
語音識別
Transformers

W
chrisvinsen
16
0
Wav2vec2 17
Apache-2.0
基於facebook/wav2vec2-base微調的語音識別模型,支持自動語音轉文本任務。
語音識別
Transformers

W
chrisvinsen
17
0
Wav2vec2 11
Apache-2.0
基於facebook/wav2vec2-base微調的語音識別模型,支持自動語音轉文本任務
語音識別
Transformers

W
chrisvinsen
18
0
Wav2vec2 10
Apache-2.0
基於facebook/wav2vec2-base微調的語音識別模型,在評估集上詞錯誤率(WER)為1.0
語音識別
Transformers

W
chrisvinsen
20
0
Wav2vec2 5
Apache-2.0
基於facebook/wav2vec2-base微調的語音識別模型,主要用於自動語音識別(ASR)任務
語音識別
Transformers

W
chrisvinsen
20
0
Wav2vec2 4
Apache-2.0
該模型是基於facebook/wav2vec2-base微調的語音識別模型,主要用於自動語音識別任務。
語音識別
Transformers

W
chrisvinsen
16
0
Wav2vec2 3
Apache-2.0
基於facebook/wav2vec2-base微調的語音識別模型,詞錯誤率(WER)為1.0
語音識別
Transformers

W
chrisvinsen
16
0
Wav2vec2 Base Demo Colab
Apache-2.0
基於facebook/wav2vec2-base模型微調的語音識別模型,在評估集上取得了31.42%的詞錯誤率
語音識別
Transformers

W
brever
16
0
20220517 150219
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-300m微調的語音識別模型,支持自動語音識別(ASR)任務。
語音識別
Transformers

2
lilitket
29
0
Wav2vec2 Base Timit Demo Colab9
Apache-2.0
該模型是基於facebook/wav2vec2-base在TIMIT數據集上微調的語音識別模型,主要用於英語語音轉文本任務。
語音識別
Transformers

W
hassnain
16
0
Wav2vec2 Base Toy Train Data Augmented
Apache-2.0
基於facebook/wav2vec2-base模型微調的語音識別模型,在增強訓練數據上進行了優化。
語音識別
Transformers

W
scasutt
22
0
Wav2vec2 Base Cv
Apache-2.0
基於facebook/wav2vec2-base在common_voice數據集上微調的語音識別模型
語音識別
Transformers

W
jiobiala24
24
0
Wav2vec2 Base 1
Apache-2.0
基於facebook/wav2vec2-base在common_voice數據集上微調的語音識別模型
語音識別
Transformers

W
jiobiala24
20
0
Wav2vec2 Base Demo Colab
Apache-2.0
該模型是基於facebook/wav2vec2-base進行微調的語音識別模型,在Colab環境下訓練完成
語音識別
Transformers

W
thyagosme
20
0
Wav2vec2 Base Demo Colab
Apache-2.0
基於facebook/wav2vec2-base微調的語音識別模型,在特定數據集上訓練,詞錯誤率(WER)為0.3391。
語音識別
Transformers

W
asakawa
24
0
- 1
- 2
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98