# 音頻處理

Wav2vec Checkpoints
Apache-2.0
基於facebook/wav2vec2-base微調的語音處理模型,在評估集上準確率達99.48%
語音識別 Transformers
W
Zeyadd-Mostaffa
19
0
Distilhubert Finetuned Gtzan 5 Epochs Finetuned Gtzan Finetuned Gtzan
基於DistilHuBERT架構的音頻分類模型,在GTZAN數據集上微調,用於音樂流派分類任務。
音頻分類 Transformers
D
duysal
5
0
Deepfake Audio Detection
Apache-2.0
基於wav2vec2-base-finetuned進一步微調的語音處理模型,在評估集上準確率達98.82%
語音識別 Transformers
D
motheecreator
1,468
7
Wav2vec2 Base Finetuned
Apache-2.0
基於facebook/wav2vec2-base模型微調的語音處理模型,在評估集上達到99.97%的準確率
語音識別 Transformers
W
mo-thecreator
19
4
Wav2vec2 Base Finetuned
Apache-2.0
基於facebook/wav2vec2-base模型微調的語音處理模型,在評估集上準確率達99.97%
語音識別 Transformers
W
motheecreator
105
4
Distilhubert Finetuned Chorddetection
Apache-2.0
基於distilhubert模型微調的和絃檢測模型,在ChordStimation數據集上訓練,評估準確率達到100%
音頻分類 Transformers
D
alejogil35
14
1
Karolgrv2
這是一個RVC(Retrieval-based Voice Conversion)模型,用於音頻到音頻的轉換任務。
語音合成 Transformers
K
sail-rvc
6
0
Vocoder Daft Punk RVC 200 Epochs
這是一個RVC(即時語音轉換)模型,經過200輪訓練,適用於語音轉換任務。
語音合成 Transformers
V
sail-rvc
1,304
0
Snoop
Snoop是一個基於RVC(Retrieval-based Voice Conversion)技術的音頻轉音頻模型,主要用於語音轉換任務。
語音合成 Transformers
S
sail-rvc
3,997
0
Ronaldo
這是一個基於RVC(Retrieval-based Voice Conversion)的語音轉換模型,可以將輸入音頻轉換為特定風格的語音。
語音合成 Transformers
R
sail-rvc
3,855
1
Drake RVC
Drake_RVC 是一個基於 RVC (Retrieval-based Voice Conversion) 技術的音頻轉音頻模型,專門用於語音轉換任務。
語音合成 Transformers
D
sail-rvc
5,043
1
Cardib2333333
這是一個基於RVC(Retrieval-based Voice Conversion)技術的語音轉換模型,能夠將輸入的音頻轉換為特定風格的語音輸出。
語音合成 Transformers
C
sail-rvc
807
1
CJ RVC V2 400 Epochs
這是一個基於RVC(Retrieval-based Voice Conversion)技術的語音轉換模型,經過400輪訓練,適用於音頻轉音頻任務。
語音合成 Transformers
C
sail-rvc
1,949
0
Andrewtate
這是一個基於RVC(Retrieval-based Voice Conversion)技術的語音轉換模型,可以將輸入音頻轉換為安德魯·泰特風格的聲音。
語音合成 Transformers
A
sail-rvc
910
3
Alvin
這是一個RVC(Retrieval-based Voice Conversion)模型,用於音頻到音頻的轉換任務。
語音合成 Transformers
A
sail-rvc
4,909
0
Audio Cls Unispeech Sat Base 100h Libri Ft Minds14 Finetune
Apache-2.0
基於microsoft/unispeech-sat-base-100h-libri-ft在minds14數據集上微調的語音分類模型
音頻分類 Transformers
A
jonastokoliu
21
0
Wav2vec2 Base Finetuned Amd
Apache-2.0
該模型是基於facebook/wav2vec2-base在未知數據集上微調的版本,主要用於語音識別任務,在評估集上達到84.55%的準確率。
語音識別 Transformers
W
justin1983
14
0
Whisper Small Ft Common Language Id
Apache-2.0
基於openai/whisper-small微調的通用語言識別模型,在評估集上準確率達88.6%
音頻分類 Transformers
W
sanchit-gandhi
256.20k
2
Wav2vec2 Base Finetuned Ie
Apache-2.0
基於facebook/wav2vec2-base模型微調的版本,用於特定任務
語音識別 Transformers
W
minoosh
14
0
Wav2vec2 Base Finetuned Ks
Apache-2.0
基於facebook/wav2vec2-base模型微調的語音識別模型,在評估集上準確率達到87.27%。
語音識別 Transformers
W
FerhatDk
38
0
Wav2vec2 Base Ft Cv3 V3
Apache-2.0
該模型是基於facebook/wav2vec2-base在Common Voice 3.0英語數據集上微調的語音識別模型,在測試集上取得了0.247的詞錯誤率。
語音識別 Transformers
W
danieleV9H
120
0
Wav2vec Trained
Apache-2.0
該模型是基於facebook/wav2vec2-base微調而成的語音識別模型,在評估集上取得了詞錯誤率0.1042的表現。
語音識別 Transformers
W
eugenetanjc
70
0
Resepformer Wsj02mix
Apache-2.0
這是一個基於RE-SepFormer架構的音頻源分離模型,由SpeechBrain實現並在WSJ0-2Mix數據集上訓練。
聲音分離 英語
R
speechbrain
488
3
Ai Light Dance Singing Ft Wav2vec2 Large Xlsr 53
Apache-2.0
該模型是基於facebook/wav2vec2-large-xlsr-53在AI_LIGHT_DANCE - ONSET-SINGING數據集上微調的自動語音識別模型,主要用於歌唱語音識別任務。
語音識別 Transformers
A
gary109
23
1
Wav2vec2 Base Vios Commonvoice 1
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-300m在Common Voice數據集上微調的語音識別模型,支持自動語音識別任務。
語音識別 Transformers
W
tclong
21
0
Wav2vec2 Final 1 Lm 3
Apache-2.0
基於facebook/wav2vec2-base微調的語音識別模型,在評估集上詞錯誤率為0.4499,使用4-Gram語言模型時可降至0.126
語音識別 Transformers
W
chrisvinsen
16
0
Wav2vec2 17
Apache-2.0
基於facebook/wav2vec2-base微調的語音識別模型,支持自動語音轉文本任務。
語音識別 Transformers
W
chrisvinsen
17
0
Wav2vec2 11
Apache-2.0
基於facebook/wav2vec2-base微調的語音識別模型,支持自動語音轉文本任務
語音識別 Transformers
W
chrisvinsen
18
0
Wav2vec2 10
Apache-2.0
基於facebook/wav2vec2-base微調的語音識別模型,在評估集上詞錯誤率(WER)為1.0
語音識別 Transformers
W
chrisvinsen
20
0
Wav2vec2 5
Apache-2.0
基於facebook/wav2vec2-base微調的語音識別模型,主要用於自動語音識別(ASR)任務
語音識別 Transformers
W
chrisvinsen
20
0
Wav2vec2 4
Apache-2.0
該模型是基於facebook/wav2vec2-base微調的語音識別模型,主要用於自動語音識別任務。
語音識別 Transformers
W
chrisvinsen
16
0
Wav2vec2 3
Apache-2.0
基於facebook/wav2vec2-base微調的語音識別模型,詞錯誤率(WER)為1.0
語音識別 Transformers
W
chrisvinsen
16
0
Wav2vec2 Base Demo Colab
Apache-2.0
基於facebook/wav2vec2-base模型微調的語音識別模型,在評估集上取得了31.42%的詞錯誤率
語音識別 Transformers
W
brever
16
0
20220517 150219
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-300m微調的語音識別模型,支持自動語音識別(ASR)任務。
語音識別 Transformers
2
lilitket
29
0
Wav2vec2 Base Timit Demo Colab9
Apache-2.0
該模型是基於facebook/wav2vec2-base在TIMIT數據集上微調的語音識別模型,主要用於英語語音轉文本任務。
語音識別 Transformers
W
hassnain
16
0
Wav2vec2 Base Toy Train Data Augmented
Apache-2.0
基於facebook/wav2vec2-base模型微調的語音識別模型,在增強訓練數據上進行了優化。
語音識別 Transformers
W
scasutt
22
0
Wav2vec2 Base Cv
Apache-2.0
基於facebook/wav2vec2-base在common_voice數據集上微調的語音識別模型
語音識別 Transformers
W
jiobiala24
24
0
Wav2vec2 Base 1
Apache-2.0
基於facebook/wav2vec2-base在common_voice數據集上微調的語音識別模型
語音識別 Transformers
W
jiobiala24
20
0
Wav2vec2 Base Demo Colab
Apache-2.0
該模型是基於facebook/wav2vec2-base進行微調的語音識別模型,在Colab環境下訓練完成
語音識別 Transformers
W
thyagosme
20
0
Wav2vec2 Base Demo Colab
Apache-2.0
基於facebook/wav2vec2-base微調的語音識別模型,在特定數據集上訓練,詞錯誤率(WER)為0.3391。
語音識別 Transformers
W
asakawa
24
0
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase