# 越南語語音識別

Whisper Small Vi
MIT
基於openai/whisper-small針對越南語語音數據微調的自動語音識別模型,提升越南語轉錄準確性和魯棒性
語音識別 Transformers 其他
W
namphungdn134
334
2
Whisper Base Vi
MIT
基於openai/whisper-base模型在100小時越南語語音數據上微調的語音識別模型,提升越南語轉錄準確性
語音識別 Transformers 其他
W
namphungdn134
215
3
Chunkformer Large Vie
基於ChunkFormer架構的大規模越南語自動語音識別模型,在約3000小時的越南語公開語音數據上微調,性能優異。
語音識別 其他
C
khanhld
1,765
12
Vi Whisper Large V3 Turbo V1
針對越南語自動語音識別(ASR)任務優化的Whisper-V3-Turbo模型,使用多個越南語數據集微調
語音識別 Transformers 其他
V
suzii
182
7
Viwhisper Medium
MIT
針對越南語語音識別任務優化的Whisper-medium模型,在1308小時越南語數據上微調
語音識別 Transformers 其他
V
NhutP
139
4
Whisper Tiny Vi
Apache-2.0
基於OpenAI Whisper-tiny架構微調的越南語自動語音識別(ASR)模型,在多個越南語數據集上表現出色
語音識別 Transformers 其他
W
doof-ferb
44
2
Phowhisper Medium
Bsd-3-clause
PhoWhisper 是一個專為越南語自動語音識別(ASR)設計的模型系列,通過在844小時越南語口音數據集上微調Whisper模型實現高魯棒性。
語音識別 Transformers 其他
P
vinai
2,999
10
Phowhisper Small
Bsd-3-clause
PhoWhisper是一個專為越南語自動語音識別設計的系統,基於Whisper模型微調,支持多種越南語口音。
語音識別 Transformers 其他
P
vinai
2,725
8
Wav2vec2 Bartpho
這是一個支持越南語的自動語音識別模型,能夠輸出規範化文本、標記時間戳以及多說話人分段。
語音識別 Transformers 其他
W
nguyenvulebinh
472
6
Whisper Large V2 Vietnamese
Apache-2.0
該模型是基於OpenAI的Whisper Small架構,在Common Voice 11.0越南語數據集上微調的自動語音識別(ASR)模型
語音識別 Transformers 其他
W
DrishtiSharma
25
2
Wav2vec2 Large Vi Vlsp2020
基於wav2vec2架構的越南語自動語音識別模型,預訓練使用1.3萬小時未標註YouTube音頻,並在250小時標註數據上微調
語音識別 Transformers 其他
W
nguyenvulebinh
385
4
Wav2vec2 Base Vietnamese 160h
基於Wav2vec2的越南語語音識別模型,在160小時越南語語音數據上微調
語音識別 Transformers 其他
W
khanhld
356
10
Viwav2vec2 Base 3k
該模型是基於3千小時越南語語音數據預訓練的Wav2Vec2基礎模型,適用於越南語語音識別任務,需在下游任務上微調後使用。
語音識別 Transformers 其他
V
dragonSwing
41
2
Viwav2vec2 Base 1.5k
該模型通過1.5千小時越南語語音數據預訓練得到,適用於越南語語音識別任務,需微調後使用。
語音識別 Transformers 其他
V
dragonSwing
38
0
Wav2vec NCKH 2022
基於Wav2vec2架構的越南語自動語音識別模型,支持從音頻到文本的轉換
語音識別 Transformers 其他
W
hoangbinhmta99
29
0
Wav2vec2 Large Xls R 300m Vietnamese Colab
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-300m在通用語音數據集上微調的越南語語音識別模型
語音識別 Transformers
W
Jungwonchang
22
0
Fine Tune XLSR Wav2Vec2 Speech2Text Vietnamese
Apache-2.0
這是一個基於MT5架構的越南語自動語音識別(ASR)修復模型,針對越南語語音識別任務進行了微調。
語音識別 其他
F
leduytan93
25
0
Xls Asr Vi 40h 1B
Apache-2.0
基於facebook/wav2vec2-xls-r-1b在40小時FPT開放語音數據集(FOSD)和公共語音數據集7.0上微調的越南語自動語音識別模型
語音識別 Transformers 其他
X
geninhu
23
0
Wav2vec2 Base Vietnamese
Apache-2.0
基於Wav2Vec2架構的越南語語音識別模型,在VSLP數據集上微調,支持16kHz採樣率的語音輸入
語音識別 Transformers 其他
W
dragonSwing
16
2
Fb Vindata Vi Large
Apache-2.0
該模型是基於facebook/wav2vec2-large-xlsr-53在PHONGDTD/VINDATAVLSP - NA數據集上微調的越南語自動語音識別模型
語音識別 Transformers
F
phongdtd
29
0
Fb Youtube Vi Large
Apache-2.0
該模型是基於facebook/wav2vec2-large-xlsr-53在越南語YouTube非正式音頻數據集上微調的自動語音識別模型。
語音識別 Transformers
F
phongdtd
31
1
Viwav2vec2 Base 100h
Apache-2.0
基於VLSP數據集中100小時未標註越南語語音音頻預訓練的Wav2Vec2基礎模型,需在下游任務上微調使用。
語音識別 Transformers 其他
V
dragonSwing
19
0
Wav2vec2 Large Xlsr 53 Vietnamese
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53模型微調的越南語自動語音識別模型,支持16kHz採樣率的語音輸入。
語音識別 Transformers 其他
W
not-tanh
22
4
Wavlm VLSP Vi
基於microsoft/wavlm-base-plus在PHONGDTD/VINDATAVLSP - NA數據集上微調的越南語自動語音識別模型
語音識別 Transformers
W
phongdtd
21
0
Wav2vec2 Base Vn 270h
基於約270小時越南語標註數據微調的語音識別模型,支持越南語自動語音識別任務
語音識別 其他
W
dragonSwing
202
8
Wavlm Vindata Demo Dist
基於microsoft/wavlm-base在越南語數據集上微調的自動語音識別模型
語音識別 Transformers
W
phongdtd
17
0
Xls Asr Vi 40h
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-300m在Common Voice 7.0越南語及私有數據集上微調的語音識別模型。
語音識別 Transformers 其他
X
geninhu
14
0
Wav2vec2 Base Vietnamese 250h
基於wav2vec 2.0架構的越南語自動語音識別模型,在13,000小時未標註音頻和250小時標註數據上訓練
語音識別 Transformers 其他
W
nguyenvulebinh
6,868
39
Wav2vec2 Large Xlsr 53 Vietnamese
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53模型微調的越南語自動語音識別模型,使用通用語音數據集訓練。
語音識別 其他
W
anuragshas
279
2
Wav2vec2 Large Xlsr Vietnamese
Apache-2.0
這是一個基於facebook/wav2vec2-large-xlsr-53模型在越南語上微調的語音識別模型,使用了Common Voice和Infore_25h數據集進行訓練。
語音識別 其他
W
CuongLD
37
1
Wav2vec2 Large Xlsr Vietnamese
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53模型微調的越南語自動語音識別模型
語音識別 其他
W
Nhut
22
0
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase