# 多場景語音處理

Whisper Large V3 Turbo Shqip
MIT
基於OpenAI Whisper Large v3 Turbo針對阿爾巴尼亞語優化的語音識別模型,支持標準阿爾巴尼亞語及蓋格方言
語音識別 Transformers 其他
W
Kushtrim
143
4
Hubert Large Korean
Apache-2.0
Hubert-large-korean是一個基於Hubert架構的韓語自動語音識別模型,通過自監督學習直接從語音波形中提取特徵,在韓語語音處理方面表現優異。
語音識別 Transformers 韓語
H
team-lucid
131
11
Hubert Base Korean
Apache-2.0
Hubert(Hidden-Unit BERT)是Facebook提出的一種語音表徵學習模型,採用自監督學習方式直接從原始波形信號中學習語音特徵。
語音識別 韓語
H
team-lucid
54
26
Wav2vec2 Large Es Voxpopuli
基於VoxPopuli語料庫西班牙語子集訓練的大型語音預訓練模型,適用於西班牙語語音識別任務
語音識別 西班牙語
W
facebook
117.04k
1
Wav2vec2 Large It Voxpopuli
基於VoxPopuli意大利語無標註數據預訓練的語音識別模型,採用Facebook的Wav2Vec2架構
語音識別 其他
W
facebook
55
0
Wav2vec2 Large Fr Voxpopuli
基於VoxPopuli法語語料庫預訓練的大型語音識別模型,支持法語語音轉文本任務
語音識別 法語
W
facebook
31
0
Wav2vec2 Xls R 300m Cv8 Es
Apache-2.0
基於facebook/wav2vec2-xls-r-300m在通用語音數據集上微調的語音識別模型
語音識別 Transformers
W
edugp
23
0
Wav2vec2 Large Xlsr Japanese 0325 1200
Apache-2.0
這是一個基於facebook/wav2vec2-large-xlsr-53模型在日語語音識別任務上微調的自動語音識別(ASR)模型。
語音識別 Transformers 日語
W
qqpann
14
0
Wav2vec2 Base Fr Voxpopuli
基於VoxPopuli法語無標註數據預訓練的Wav2Vec2基礎模型,適用於法語語音識別任務
語音識別 Transformers 法語
W
facebook
30
0
Wav2vec2 Base Es Voxpopuli
基於VoxPopuli西班牙語無標註數據預訓練的Wav2Vec2語音識別基礎模型
語音識別 Transformers 西班牙語
W
facebook
39
2
Wav2vec2 Large Xls R 300m Slovenian
Apache-2.0
基於facebook/wav2vec2-xls-r-300m在斯洛文尼亞語語音數據集上微調的自動語音識別模型
語音識別 Transformers 其他
W
infinitejoy
13
0
Wav2vec2 FR 1K Base
Apache-2.0
基於1千小時法語語音訓練的wav2vec2基礎模型,支持語音識別等任務
語音識別 Transformers 法語
W
LeBenchmark
85
1
Wav2vec2 Large Xls R 300m Or D5
Apache-2.0
這是一個基於facebook/wav2vec2-xls-r-300m在奧里亞語數據集上微調的自動語音識別(ASR)模型,專門用於奧里亞語的語音轉文本任務。
語音識別 Transformers 其他
W
DrishtiSharma
24
0
Wav2vec2 Large Xls R 300m Hsb V2
Apache-2.0
這是一個基於Facebook的wav2vec2-xls-r-300m模型在上索布語(HSB)數據集上微調的自動語音識別(ASR)模型。
語音識別 Transformers 其他
W
DrishtiSharma
19
0
Wav2vec2 FR 3K Base
Apache-2.0
基於2.9K小時法語語音訓練的wav2vec2基礎模型,支持自發、朗讀和廣播語音
語音識別 Transformers 法語
W
LeBenchmark
31
0
Wav2vec2 Xls R 300m Romanian
Apache-2.0
基於facebook/wav2vec2-xls-r-300m微調的羅馬尼亞語語音識別模型,在Common Voice羅馬尼亞語測試集上WER為12.46%
語音識別 Transformers
W
Dumiiii
24
0
Wav2vec2 FR 3K Large
Apache-2.0
基於2.9K小時法語語音訓練的大型wav2vec2模型,支持自發語音、朗讀語音和廣播語音處理
語音識別 法語
W
LeBenchmark
948
1
W2v Xlsr Dutch Lm
這是一個基於wav2vec2架構的荷蘭語語音識別模型,由Facebook開發,專門針對荷蘭語進行了優化。
語音識別 Transformers
W
Iskaj
23
0
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase