# 多場景語音轉寫

Whisper Fa Tinyyy
MIT
基於OpenAI Whisper-tiny微調的波斯語自動語音識別模型,在common_voice_11_0數據集上訓練
語音識別 Transformers 其他
W
hackergeek98
55
2
Whisper Large V3 Turbo Es
MIT
基於Whisper-large-v3-turbo微調的西班牙語語音識別模型,在Common Voice 17.0西班牙語數據集上詞錯誤率降低至5.34%
語音識別 Transformers 西班牙語
W
adriszmar
52
4
Whisper Large V3 Turkish Test1
Apache-2.0
基於OpenAI Whisper-large-v3模型在Common Voice 17.0土耳其語數據集上微調的語音識別模型
語音識別 Transformers 其他
W
erdiyalcin
21
3
Whisper Small Sinhala Fine Tune
Apache-2.0
基於OpenAI Whisper-small模型在僧伽羅語上進行微調的語音識別模型
語音識別 Transformers
W
Subhaka
78
6
Whisper Medium Et
基於約800小時多樣化愛沙尼亞語數據微調的Whisper-medium模型,適用於通用語音識別場景
語音識別 Transformers
W
TalTechNLP
115
2
Whisper Medium Turkish 2
Apache-2.0
基於OpenAI Whisper Medium微調的土耳其語語音識別模型,在Common Voice 11.0數據集上訓練
語音識別 Transformers 其他
W
emre
267
15
Whisper Large V2 Serbian
Apache-2.0
這是基於OpenAI Whisper Large-V2模型在塞爾維亞語Common Voice 11.0數據集上微調的語音識別模型,詞錯誤率為10.76%。
語音識別 Transformers 其他
W
DrishtiSharma
39
3
Exp W2v2t Fa Hubert S801
Apache-2.0
基於facebook/hubert-large-ll60k模型微調的波斯語自動語音識別模型,使用Common Voice 7.0波斯語數據集訓練。
語音識別 Transformers 其他
E
jonatasgrosman
16
0
Exp W2v2t Sv Se Vp Nl S842
Apache-2.0
這是一個基於facebook/wav2vec2-large-nl-voxpopuli模型微調的瑞典語自動語音識別模型,使用Common Voice 7.0 (sv-SE)數據集進行訓練。
語音識別 Transformers
E
jonatasgrosman
16
0
Wav2vec2 Large Xls R 300m Pt Colab
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-300m在common_voice_9_0數據集上微調的語音識別模型,支持葡萄牙語語音轉文本任務。
語音識別 Transformers
W
robertodtg
107
0
Wav2vec2 Large Xls R 300m Turkish Colab
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-300m在通用語音數據集上微調的土耳其語語音識別模型
語音識別 Transformers
W
pinot
16
0
W2v Xls R Uk
Apache-2.0
基於facebook/wav2vec2-xls-r-300m的烏克蘭語自動語音識別模型,在Common Voice 10.0數據集上訓練
語音識別 Transformers 其他
W
Yehor
231.46k
8
Wav2vec2 Large Xls R 300m Turkish Colab
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-300m在common_voice數據集上微調的土耳其語語音識別模型
語音識別 Transformers
W
bansals10
23
0
Wav2vec2 Large Xls R 300m Russian Colab Beam Search Test
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-300m在通用語音數據集上微調的俄語語音識別模型,在評估集上取得了0.468的詞錯誤率。
語音識別 Transformers
W
jfealko
18
0
Wav2vec2 Large Xlsr 53 Dutch
Apache-2.0
Facebook開發的基於Wav2Vec 2.0架構的荷蘭語自動語音識別(ASR)模型,採用XLSR-53多語言預訓練模型微調
語音識別 其他
W
facebook
203
2
Wav2vec2 Large Xls R 300m Ur
Apache-2.0
基於wav2vec2-large-xls-r-300m架構的烏爾都語語音識別模型,在common_voice數據集上微調
語音識別 Transformers
W
anuragshas
20
0
Wav2vec2 Xlsr Estonian
Apache-2.0
這是一個基於facebook/wav2vec2-xls-r-1b模型在愛沙尼亞語數據集上微調的自動語音識別模型。
語音識別 Transformers 其他
W
sammy786
21
1
Wav2vec2 Large Nl Voxpopuli
基於VoxPopuli語料庫荷蘭語子集預訓練的自動語音識別模型
語音識別 其他
W
facebook
18
0
Wav2vec2 Large Xls R 300m Urdu
Apache-2.0
基於facebook/wav2vec2-xls-r-300m在Common Voice 8烏爾都語數據集上微調的語音識別模型
語音識別 Transformers 其他
W
kingabzpro
91.36k
13
Wav2vec2 Large Xlsr 53 Portuguese
Apache-2.0
Facebook開發的基於Wav2Vec 2.0架構的大規模葡萄牙語自動語音識別(ASR)模型,支持葡萄牙語語音轉文本任務。
語音識別 其他
W
facebook
425
6
Wav2vec2 Base Sv Voxpopuli
基於VoxPopuli語料庫瑞典語子集預訓練的Wav2Vec2基礎模型,適用於瑞典語語音識別任務。
語音識別 Transformers 其他
W
facebook
33
0
Wav2vec2 Large Xls R 300m Basque
Apache-2.0
基於facebook/wav2vec2-xls-r-300m在巴斯克語Common Voice數據集上微調的自動語音識別模型
語音識別 Transformers 其他
W
deepdml
31
0
Wav2vec2 Common Voice Tr Demo
Apache-2.0
該模型是基於facebook/wav2vec2-large-xlsr-53在COMMON_VOICE SV-SE數據集上微調的自動語音識別(ASR)模型,支持瑞典語語音識別。
語音識別 Transformers
W
birgermoell
17
0
Wav2vec2 Base It Voxpopuli
基於VoxPopuli意大利語無標註數據預訓練的Wav2Vec2基礎模型,適用於語音識別任務。
語音識別 Transformers 其他
W
facebook
32
0
Wav2vec2 Large Xls R 300m Spanish Custom
Apache-2.0
這是一個基於facebook/wav2vec2-xls-r-300m模型在common_voice西班牙語數據集上微調的語音識別模型,在評估集上取得了21.17%的詞錯誤率。
語音識別 Transformers
W
tomascufaro
15
0
Xlsr Fa Lm
基於通用語音波斯語數據微調的XLS-R-300m語音識別模型
語音識別 Transformers 其他
X
manifoldix
16
1
Wav2vec2 Large Xls R 300m Turkish Colab
Apache-2.0
基於facebook/wav2vec2-xls-r-300m在common_voice土耳其語數據集上微調的語音識別模型
語音識別 Transformers
W
chaitanya97
23
0
Wav2vec2 Xlsr Georgian
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-1b在格魯吉亞語數據集上微調的自動語音識別模型
語音識別 Transformers 其他
W
sammy786
19
1
Wav2vec2 Xls R 300m Uk
MIT
這是一個基於facebook/wav2vec2-xls-r-300m模型在烏克蘭語數據集上微調的自動語音識別(ASR)模型,在Common Voice烏克蘭語測試集上取得了12.22%的詞錯誤率(WER)。
語音識別 Transformers 其他
W
robinhad
72
5
Wav2vec2 Base Turkish Cv8
這是一個基於Common Voice 8.0土耳其語數據集微調的自動語音識別(ASR)模型,能夠將土耳其語語音轉換為文本。
語音識別 Transformers 其他
W
cahya
16
1
Wav2vec2 Large Xls R 300m Latvian
Apache-2.0
這是一個基於facebook/wav2vec2-xls-r-300m在拉脫維亞語數據集上微調的自動語音識別模型,在Common Voice 7測試集上取得了16.98%的WER。
語音識別 Transformers 其他
W
infinitejoy
222
1
Wav2vec2 Large Xls R 300m Bulgarian
Apache-2.0
基於facebook/wav2vec2-xls-r-300m在MOZILLA-FOUNDATION/COMMON_VOICE_7_0 - BG數據集上微調的保加利亞語語音識別模型
語音識別 Transformers 其他
W
infinitejoy
10.59k
2
Wav2vec2 Large Xlsr Greek 1
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53在希臘語上微調的語音識別模型,支持16kHz採樣率的語音輸入。
語音識別 Transformers 其他
W
skylord
15
0
Xls Npsc Oh
該模型是基於KBLab/wav2vec2-large-voxrex在NBAILAB/NPSC - 48K_MP3數據集上微調的自動語音識別模型
語音識別 Transformers
X
NbAiLab
30
0
Wav2vec2 Large Xls R 300m Pa IN Dx1
Apache-2.0
這是一個基於facebook/wav2vec2-xls-r-300m在旁遮普語(印度)數據集上微調的自動語音識別模型
語音識別 Transformers
W
DrishtiSharma
28
0
Wav2vec2 Large Xlsr 53 Frisian
Apache-2.0
這是一個基於wav2vec2-large-xlsr-53模型微調的弗里斯蘭語自動語音識別(ASR)模型,由RuudVelo開發。
語音識別
W
RuudVelo
31
0
Wav2vec2 Large Xls R 300m Bg V1
Apache-2.0
這是一個基於facebook/wav2vec2-xls-r-300m模型在保加利亞語語音數據集上微調的自動語音識別(ASR)模型。
語音識別 Transformers 其他
W
DrishtiSharma
16
1
Wav2vec2 Large Xls R 300m As V9
Apache-2.0
基於facebook/wav2vec2-xls-r-300m在阿薩姆語(Common Voice 8.0)數據集上微調的自動語音識別模型
語音識別 Transformers 其他
W
DrishtiSharma
20
0
Wav2vec2 Xls R 300m Cv8 Turkish
Apache-2.0
這是一個基於Facebook的wav2vec2-xls-r-300m模型在土耳其語Common Voice 8數據集上微調的自動語音識別(ASR)模型。
語音識別 Transformers 其他
W
Baybars
16
0
Wav2vec2 Large Xls R 300m Hsb V1
Apache-2.0
這是一個基於facebook/wav2vec2-xls-r-300m在上索布語(HSB)數據集上微調的自動語音識別模型,在Common Voice 8測試集上取得了0.4393的詞錯誤率(WER)。
語音識別 Transformers 其他
W
DrishtiSharma
20
0
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase