# 語音轉文本

Whisper Finetuned Amharic
Apache-2.0
基於openai/whisper-small微調的阿姆哈拉語語音識別模型,在評估集上詞錯誤率為2.0538%
語音識別 Transformers
W
seyyaw
57
1
Wav2vec2 Large Xls R 300m Ru
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-300m在common_voice_17_0數據集上微調的俄語自動語音識別(ASR)模型,詞錯誤率(WER)為0.195。
語音識別 Transformers
W
NLPVladimir
56
1
Whisper Hindi2Hinglish Swift
Apache-2.0
基於Whisper架構優化的印地語-印地英語混合語音識別模型,專為印度口音和噪聲環境優化
語音識別 Transformers 支持多種語言
W
Oriserve
496
6
Moonshine Base ONNX
MIT
基於Moonshine基礎模型的ONNX格式自動語音識別模型,支持高效推理
語音識別 Transformers
M
onnx-community
1,171
29
Whisper Large V3 Turbo Arabic
Apache-2.0
基於transformers庫,在common_voice_11_0數據集上對openai/whisper-large-v3-turbo進行微調後的版本,專為阿拉伯語語音識別優化。
語音識別 Transformers
W
mboushaba
1,696
1
Whisper Large V3 Turbo
基於ONNX格式優化的Whisper大型語音識別模型,專為網頁端部署設計
語音識別 Transformers
W
onnx-community
2,988
54
W2V2 BERT Withlm Malayalam
MIT
基於facebook/w2v-bert-2.0微調的馬拉雅拉姆語自動語音識別模型,在多個馬拉雅拉姆語數據集上訓練,並使用了KENLM庫訓練的三元語言模型。
語音識別 Transformers 其他
W
vrclc
65
3
Whisper Base
Whisper是一個自動語音識別(ASR)系統,由OpenAI訓練,支持多語言語音轉錄。
語音識別 Transformers
W
onnx-community
5,704
19
Faster Distil Whisper Large V3
MIT
Whisper Large v3的蒸餾版本,用於高效自動語音識別(ASR)
語音識別 英語
F
Systran
18.55k
49
Distil Whisper Large V3
Apache-2.0
該模型是從GGML格式的distil-whisper/distil-large-v3-ggml轉換至Ratchet自定義格式的版本,主要用於語音識別任務。
語音識別
D
FL33TW00D-HF
164
4
Whisper Tiny
Apache-2.0
這是將openai/whisper-tiny的GGML格式轉換為Ratchet自定義格式的版本
語音識別
W
FL33TW00D-HF
17.21k
5
Language Detector
Apache-2.0
基於openai/whisper-small微調的語言檢測模型,在評估集上準確率達96.47%
語音識別 Transformers
L
fitlemon
18
1
Audio Transcribe
這是一個基於Transformers的自動語音識別(ASR)模型,用於將音頻文件轉錄為文本。
語音識別
A
washeed
257
4
Audiosangraha Audio To Text
Apache-2.0
基於openai/whisper-small微調的語音轉文本模型,支持音頻翻譯和文本生成任務。
語音識別 Transformers
A
AqeelShafy7
224
4
Whisper Large V3 Ft Cv16 Mn
Apache-2.0
基於OpenAI Whisper Large V3模型在Common Voice 16.0數據集上微調的語音識別模型
語音識別 Transformers
W
sanchit-gandhi
34
1
Whisper Large V3
Whisper-large-v3是OpenAI開源的自動語音識別(ASR)模型,支持多種語言的語音轉文字任務。
語音識別 Transformers
W
Xenova
1,443
9
Speecht5 Tts Marathi
這是一個用於馬拉地語語音處理的模型,可能涉及語音識別或語音合成任務。
語音識別 Transformers
S
Patil
26
0
Whisper Large V2 Spanish
Apache-2.0
基於OpenAI Whisper-large-v2模型在Common Voice 13.0西班牙語數據集上微調的語音識別模型
語音識別 Transformers
W
Sandiago21
38
3
Whisper Medium
Whisper Medium 是 OpenAI 開發的中等規模語音識別模型,支持多種語言的自動語音識別(ASR)任務。
語音識別 Transformers
W
Xenova
871
4
Whisper Small
Whisper Small 是 OpenAI 開發的一個小型自動語音識別(ASR)模型,能夠將語音轉換為文本。
語音識別 Transformers
W
Xenova
1,716
9
Whisper Base
Whisper是一個自動語音識別(ASR)系統,由OpenAI訓練,支持多種語言的語音轉文本任務。
語音識別 Transformers
W
Xenova
6,204
7
Whisper Tiny
Whisper Tiny 是 OpenAI 開源的輕量級語音識別模型,適用於網頁端部署。
語音識別 Transformers
W
Xenova
21.70k
8
Faster Whisper Tiny
MIT
這是OpenAI Whisper-tiny模型的CTranslate2轉換版本,用於高效的語音識別任務。
語音識別 支持多種語言
F
guillaumekln
1,547
6
Speecht5 Asr
MIT
基於LibriSpeech數據集微調的SpeechT5自動語音識別模型,支持將語音轉換為文本。
語音識別 Transformers
S
microsoft
12.30k
41
Whisper Base
Apache-2.0
Whisper是一個預訓練的自動語音識別(ASR)和語音翻譯模型,經過68萬小時標註數據訓練,具有強大的泛化能力。
語音識別 支持多種語言
W
openai
491.35k
216
Wav2vec2 Large 960h Lv60 Self 4 Gram Fine Tune Real 29 Jun
Apache-2.0
該模型是基於facebook/wav2vec2-large-960h-lv60-self在uob_singlish數據集上微調的語音識別模型,支持新加坡英語識別。
語音識別 Transformers
W
RuiqianLi
105
0
Wav2vec2 Large Xls R 300m Bn Colab
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-300m在common_voice_9_0數據集上微調的語音識別模型,支持孟加拉語。
語音識別 Transformers
W
rhr99
18
0
Wav2vec2 Xls R 300m Mrbrown Finetune1
Apache-2.0
基於facebook/wav2vec2-xls-r-300m預訓練模型,使用uob_singlish數據集進行微調的語音識別模型
語音識別 Transformers
W
RuiqianLi
18
0
Wav2vec2 Large Multilang Cv Ru
Apache-2.0
該模型是基於facebook/wav2vec2-large-xlsr-53在common_voice數據集上微調的版本,主要用於俄語語音識別任務。
語音識別 Transformers
W
cutten
16
0
Wav2vec2 Large Xls R 300m Ta Colab
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-300m在common_voice數據集上微調的版本,主要用於泰米爾語的語音識別任務。
語音識別 Transformers
W
AAkhilesh
24
0
84rry Xlsr 53 Arabic
Apache-2.0
該模型是基於facebook/wav2vec2-large-xlsr-53在通用語音數據集上微調的阿拉伯語語音識別模型
語音識別 Transformers
8
84rry
24
0
Wav2vec2 Large Xls R 300m Turkish Colab Common Voice 8 6
Apache-2.0
這是一個基於wav2vec2架構的土耳其語語音識別模型,在common_voice數據集上微調得到
語音識別 Transformers
W
husnu
21
0
Wav2vec2 Large Xls R 300m Turkish Colab Common Voice 8 4
Apache-2.0
該模型是基於Facebook的wav2vec2-xls-r-300m模型,在common_voice土耳其語數據集上微調的語音識別模型。
語音識別 Transformers
W
husnu
19
0
Dansk Wav2vec21
Apache-2.0
該模型是基於Siyam/SKYLy在common_voice數據集上微調得到的丹麥語語音識別模型
語音識別 Transformers
D
Siyam
32
0
Wav2vec2 Vorarlbergerisch
Apache-2.0
基於facebook/wav2vec2-base-960h微調的德語方言語音識別模型,支持奧地利福拉爾貝格地區方言識別
語音識別 Transformers
W
bkh6722
21
0
Wav2vec2 Base MIR ST500 ASR 109
Apache-2.0
基於facebook/wav2vec2-base在MIR_ST500數據集上微調的自動語音識別模型
語音識別 Transformers
W
gary109
15
0
Wav2vec2 Large Xls R 300m Turkish Colab
Apache-2.0
這是一個基於Facebook的wav2vec2-xls-r-300m模型在通用語音數據集上微調的土耳其語語音識別模型。
語音識別 Transformers
W
jekdoieao
30
0
2nd Wav2vec2 L Xls R 300m Turkish Test
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-300m在common_voice土耳其語數據集上微調的語音識別模型,在評估集上取得了0.4444的詞錯誤率。
語音識別 Transformers
2
Khalsuu
29
0
Wav2vec2 Large Xls R 300m Turkish Colab
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-300m在common_voice土耳其語數據集上微調的語音識別模型,在評估集上取得了30.95%的詞錯誤率。
語音識別 Transformers
W
dennisowusuk
15
0
Wav2vec2 Common Voice Accents Scotland
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-300m在common_voice數據集上微調的版本,專注於蘇格蘭口音的語音識別。
語音識別 Transformers
W
willcai
19
0
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase