# 多場景ASR

Parakeet Tdt 0.6b V2 Mlx
這是一個自動語音識別模型,已轉換為適用於MLX的版本,可快速進行推理。
語音識別 Safetensors 英語
P
senstella
183
6
Whisper Base Vi
MIT
基於openai/whisper-base模型在100小時越南語語音數據上微調的語音識別模型,提升越南語轉錄準確性
語音識別 Transformers 其他
W
namphungdn134
215
3
Whisper Large V3 Russian Ties Podlodka V1.0
基於TIES合併方法融合的俄語語音識別模型,優化電話語音識別效果
語音識別 Transformers 其他
W
Apel-sin
96
1
Whisper Small El
Apache-2.0
這是一個基於openai/whisper-small模型在希臘語語音識別任務上微調的自動語音識別(ASR)模型,使用Mozilla Common Voice 17.0數據集中的3620個希臘語樣本進行訓練。
語音識別 Transformers 其他
W
mozilla-ai
94
1
Whisper Small Sinhala V3
Apache-2.0
該模型是基於openai/whisper-small在僧伽羅語數據集上微調的語音識別模型,支持僧伽羅語語音轉文本任務。
語音識別 Transformers 其他
W
Lingalingeswaran
75
3
Distil Whisper Large V3 Int8 Ov
MIT
這是一個經過轉換和量化的語音識別模型,基於distil-large-v3模型轉換為OpenVINO™ IR格式,並將權重壓縮為INT8,以提升性能和兼容性。
語音識別 Transformers 英語
D
OpenVINO
2,103
3
Whisper Small Turkish V2
Apache-2.0
基於OpenAI Whisper-small模型在土耳其語Common Voice數據集上微調的語音識別模型
語音識別 Transformers 其他
W
atakanince
61
2
Whisper Large Et
基於OpenAI Whisper-large-v2微調的愛沙尼亞語語音識別模型,由塔爾圖理工大學開發,訓練數據約1200小時
語音識別 Transformers 其他
W
TalTechNLP
245
5
Whisper Large V2 Hindi 2.5k Steps
Apache-2.0
這是一個基於OpenAI Whisper Large V2模型微調的印地語自動語音識別(ASR)模型,在Common Voice 11.0數據集上訓練,詞錯誤率(WER)為10.05%。
語音識別 Transformers 其他
W
DrishtiSharma
52
2
Whisper Large V2 Vietnamese
Apache-2.0
該模型是基於OpenAI的Whisper Small架構,在Common Voice 11.0越南語數據集上微調的自動語音識別(ASR)模型
語音識別 Transformers 其他
W
DrishtiSharma
25
2
Whisper Small Sk Cv11
Apache-2.0
基於OpenAI Whisper-small微調的斯洛伐克語語音識別模型,在Common Voice 11.0斯洛伐克語數據集上訓練
語音識別 Transformers 其他
W
mikr
79
2
Whisper Medium Pt
Apache-2.0
針對葡萄牙語優化的Whisper Medium語音識別模型,在Common Voice 11數據集上達到6.579詞錯誤率(WER)
語音識別 Transformers 其他
W
jlondonobo
85
15
Exp W2v2t It Xlsr 53 S387
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53模型微調的意大利語自動語音識別模型,使用Common Voice 7.0意大利語數據集訓練。
語音識別 Transformers 其他
E
jonatasgrosman
18
0
Exp W2v2t Th Wav2vec2 S664
Apache-2.0
基於facebook/wav2vec2-large-lv60模型微調的泰語語音識別模型,使用Common Voice 7.0數據集訓練
語音識別 Transformers 其他
E
jonatasgrosman
14
0
Wav2vec2 Large Xlsr 53 German Cv9
Apache-2.0
這是一個基於Facebook的wav2vec2-large-xlsr-53模型在德語Common Voice 9.0數據集上微調的自動語音識別(ASR)模型。
語音識別 Transformers 德語
W
oliverguhr
98
1
Wav2vec NCKH 2022
基於Wav2vec2架構的越南語自動語音識別模型,支持從音頻到文本的轉換
語音識別 Transformers 其他
W
hoangbinhmta99
29
0
Xlsr 53 Wav2vec Hi
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53微調的印地語語音識別模型,在低資源印度語言的多語言和語碼轉換ASR挑戰賽數據上訓練
語音識別 Transformers 其他
X
harshit345
38
0
Wav2vec2 Large Xls R 300m Tr
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-300m在土耳其語Common Voice 8.0數據集上微調的自動語音識別(ASR)模型,測試WER為28.69%。
語音識別 Transformers 其他
W
emre
25
0
Xls R 300m Te
Apache-2.0
基於facebook/wav2vec2-xls-r-300m在OpenSLR SLR66泰盧固語數據集上微調的自動語音識別模型
語音識別 Transformers 其他
X
chmanoj
25
0
Xls R 300m Et
基於facebook/wav2vec2-xls-r-300m微調的愛沙尼亞語自動語音識別模型,使用約800小時多樣化數據訓練
語音識別 Transformers 其他
X
TalTechNLP
58
1
Xlsr Indonesia
Apache-2.0
基於XLSR架構微調的印尼語自動語音識別(ASR)模型,在Common Voice印尼語數據集上訓練
語音識別 Transformers 其他
X
acul3
23
0
Xls Asr Vi 40h
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-300m在Common Voice 7.0越南語及私有數據集上微調的語音識別模型。
語音識別 Transformers 其他
X
geninhu
14
0
Newnew
Apache-2.0
基於facebook/wav2vec2-xls-r-300m在荷蘭語(nl)數據集上微調的自動語音識別(ASR)模型
語音識別 Transformers 其他
N
Iskaj
39
0
Wav2vec2 Large Xls R 300m Hindi Kaggle
基於common_voice數據集訓練的印地語語音識別模型
語音識別 Transformers 其他
W
Saitomar
27
0
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase