# 低詞錯誤率

Phi 4 Mm Inst Asr Singlish
MIT
針對新加坡英語優化的多模態語音識別模型,基於微軟Phi-4多模態指令模型微調,顯著提升對新加坡英語獨特語音特徵的識別能力。
音頻生成文本 Transformers 支持多種語言
P
mjwong
61
0
Wav2vec2 Base Librispeech Demo Colab
Apache-2.0
該模型是基於facebook/wav2vec2-base在LibriSpeech數據集上微調的語音識別模型,在評估集上取得了0.3174的詞錯誤率。
語音識別 Transformers
W
vishwasgautam
14
0
Hubert Base Librispeech Demo Colab
Apache-2.0
基於facebook/hubert-large-ls960-ft微調的語音識別模型,在LibriSpeech數據集上訓練
語音識別 Transformers
H
vishwasgautam
101
0
Whisper Small Vi
MIT
基於openai/whisper-small針對越南語語音數據微調的自動語音識別模型,提升越南語轉錄準確性和魯棒性
語音識別 Transformers 其他
W
namphungdn134
334
2
Whisper Large V3 French Distil Dec16 Ct2
MIT
這是Whisper Large V3的法語蒸餾版本,專為法語自動語音識別優化,通過ctranslate2實現高效推理。
語音識別 法語
W
Kelno
35
1
W2v Bert 2.0 Naijavoices Clearglobal Hausa 500hr V0
MIT
基於facebook/w2v-bert-2.0微調的豪薩語語音識別模型,在500小時豪薩語數據上訓練,詞錯誤率7.47%
語音識別 Transformers
W
asr-africa
16
1
Whisper Persian Turbooo
MIT
基於OpenAI Whisper-large-v3-turbo優化的波斯語自動語音識別模型,支持醫療領域應用
語音識別 Transformers 其他
W
hackergeek98
51
2
Whisper Base Vi
MIT
基於openai/whisper-base模型在100小時越南語語音數據上微調的語音識別模型,提升越南語轉錄準確性
語音識別 Transformers 其他
W
namphungdn134
215
3
Whisper Large V3 Persian Common Voice 17
MIT
基於Whisper Large v3微調的波斯語自動語音識別模型,使用Common Voice 17數據集訓練,顯著提升了波斯語識別準確率。
語音識別 Transformers 其他
W
msghol
442
2
Whisper Large V3 Vaani Hindi
Apache-2.0
基於OpenAI的Whisper-Large-V3模型微調的印地語語音識別模型,訓練數據包含約718小時的印地語轉錄語音
語音識別 Safetensors
W
ARTPARK-IISc
15.55k
3
Indian Accent English Whisper Finetuned Epoch 15
MIT
基於OpenAI Whisper-large-v3-turbo微調的印度英語口音語音識別模型,在印度英語口音數據集上取得7.99%的詞錯誤率
語音識別 Transformers 英語
I
Tejveer12
21
2
Wav2vec2 Large Xlsr 53 Hungarian
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53在匈牙利語Common Voice數據集上微調的自動語音識別模型
語音識別 Transformers 其他
W
sarpba
17
1
Whisper Small Fr
Apache-2.0
這是一個基於法語數據集微調的Whisper-small語音識別模型,詞錯誤率相比基線模型降低了6.793個百分點。
語音識別 Transformers 法語
W
mozilla-ai
30
1
Lite Whisper Large V3 Turbo Acc
Apache-2.0
Lite-Whisper 是採用 LiteASR 技術壓縮的 OpenAI Whisper 輕量版本,在保持高準確率的同時減小模型大小。
語音識別 Transformers
L
efficient-speech
7,414
7
Whisper Uz
Apache-2.0
基於OpenAI Whisper Medium模型微調的烏茲別克語自動語音識別模型
語音識別 Transformers 其他
W
mustafoyev202
110
1
Whisper Finetuned
MIT
基於Whisper-large-v3-turbo微調的印度英語口音語音識別模型,詞錯誤率4.39%
語音識別 Transformers 英語
W
Tejveer12
25
2
Kb Whisper Small
Apache-2.0
瑞典國家圖書館發佈的Whisper模型,專為瑞典語優化,在50,000+小時瑞典語音數據上訓練,性能超越OpenAI原版
語音識別 Transformers 其他
K
KBLab
28.61k
3
Kb Whisper Medium
Apache-2.0
瑞典國家圖書館發佈的基於超過5萬小時瑞典語音訓練的Whisper模型,在瑞典語音識別任務上表現優異
語音識別 Transformers 其他
K
KBLab
691
3
Kb Whisper Large
Apache-2.0
瑞典國家圖書館發佈的基於Whisper架構的瑞典語語音識別模型,訓練數據超過5萬小時,顯著降低詞錯誤率。
語音識別 Transformers 其他
K
KBLab
8,880
42
Quran Whisper Base Fine Tune
Apache-2.0
該模型是基於openai/whisper-base在quran-ayat-speech-to-text數據集上微調的阿拉伯語語音識別模型,專注於古蘭經經文的語音轉文字任務。
語音識別 Transformers 阿拉伯語
Q
Baselhany
35
1
Whisper Large V3 Turbo STT Zeroth KO V2
基於Whisper Large v3 Turbo優化的韓語自動語音識別模型,提供高準確率且帶時間戳的轉寫結果
語音識別 Transformers 韓語
W
o0dimplz0o
662
3
Chunkformer Large Vie
基於ChunkFormer架構的大規模越南語自動語音識別模型,在約3000小時的越南語公開語音數據上微調,性能優異。
語音識別 其他
C
khanhld
1,765
12
Whisper Finetuned Amharic
Apache-2.0
基於openai/whisper-small微調的阿姆哈拉語語音識別模型,在評估集上詞錯誤率為2.0538%
語音識別 Transformers
W
seyyaw
57
1
Wav2vec2 Large Xls R 300m Ru
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-300m在common_voice_17_0數據集上微調的俄語自動語音識別(ASR)模型,詞錯誤率(WER)為0.195。
語音識別 Transformers
W
NLPVladimir
56
1
Whisper Small Tajik
Apache-2.0
基於OpenAI Whisper-small微調的塔吉克語自動語音識別模型,在Google Fleurs數據集上訓練,詞錯誤率24.26%。
語音識別 Transformers 其他
W
abduaziz
25
1
Audiox South V1
Apache-2.0
AudioX是由Jivi AI開發的多語言自動語音識別模型,專門針對印度南方語言優化,支持泰米爾語、泰盧固語、卡納達語和馬拉雅拉姆語。
語音識別 其他
A
jiviai
148
1
Whisper Large V3 Turbo Shqip
MIT
基於OpenAI Whisper Large v3 Turbo針對阿爾巴尼亞語優化的語音識別模型,支持標準阿爾巴尼亞語及蓋格方言
語音識別 Transformers 其他
W
Kushtrim
143
4
Whisper Small For Quran
Apache-2.0
基於OpenAI Whisper-small微調的古蘭經語音識別模型,專為阿拉伯語古蘭經音頻設計
語音識別 Transformers 阿拉伯語
W
areaz
26
2
German RAG WHISPER LARGE V3 TURBO HESSIAN AI
MIT
基於Whisper Large v3 Turbo優化的德語語音識別模型,在13小時精選數據集上微調,顯著提升德語識別準確率
語音識別 Transformers 德語
G
avemio
282
1
Whisper Uz
Apache-2.0
基於Whisper Base微調的烏茲別克語語音識別模型,在Common Voice數據集上訓練
語音識別 Transformers 其他
W
jamshidahmadov
1,179
3
Whisper Khanacademy Large V3 Turbo Tr
MIT
基於OpenAI Whisper-large-v3-turbo模型在土耳其語可汗學院數據集上微調的自動語音識別(ASR)模型
語音識別 Transformers 其他
W
ysdede
31
1
Voice Clone Large Finetune Final
Apache-2.0
該模型是基於openai/whisper-large-v3微調的語音克隆模型,主要用於語音識別任務,在評估集上詞錯誤率為15.3572。
語音識別 Transformers
V
neuronbit
37
2
Whisper Tiny German 1224
Apache-2.0
基於Whisper架構優化的德語語音識別模型,參數量3900萬,支持高效德語語音轉錄
語音識別 Transformers 德語
W
primeline
322
9
Whisper Large V3 Turbo German Ct2
Apache-2.0
基於 Whisper Large v3 的德語語音識別模型,專為德語語音處理和識別優化
語音識別 Transformers 德語
W
jimmymeister
38
3
Whisper Large V3 Turbo Common Voice 19 0 Zh TW
MIT
基於OpenAI Whisper-large-v3-turbo微調的繁體中文(臺灣)自動語音識別模型
語音識別 Transformers 中文
W
JacobLinCool
220
4
Pathumma Whisper Th Large V3
Apache-2.0
Pathumma Whisper Large V3 是一個基於 OpenAI Whisper 架構的泰語自動語音識別模型,支持泰語和英語的語音轉錄任務。
語音識別 Transformers 支持多種語言
P
nectec
352
4
Whisper Large V3 Lv Late Cv19
Apache-2.0
基於whisper-large-v3微調的拉脫維亞語自動語音識別模型,由AiLab.lv訓練,支持拉脫維亞語語音轉文本任務。
語音識別 其他
W
AiLab-IMCS-UL
162
1
Whisper Base Hungarian V1
基於OpenAI Whisper-base模型微調的匈牙利語語音識別模型,在1200小時匈牙利語數據上訓練,表現優於同類模型
語音識別 Transformers 其他
W
sarpba
26
7
Whisper Large V3 Turbo Turkish
MIT
基於openai/whisper-large-v3-turbo在Common Voice 17.0數據集上微調的土耳其語語音識別模型
語音識別 Transformers 其他
W
selimc
289
6
Whisper Large V3 Turbo Es
MIT
基於Whisper-large-v3-turbo微調的西班牙語語音識別模型,在Common Voice 17.0西班牙語數據集上詞錯誤率降低至5.34%
語音識別 Transformers 西班牙語
W
adriszmar
52
4
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase