Whisper Finetuned Amharic
Apache-2.0
基於openai/whisper-small微調的阿姆哈拉語語音識別模型,在評估集上詞錯誤率為2.0538%
語音識別
Transformers

W
seyyaw
57
1
Wav2vec2 Large Xls R 300m Ru
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-300m在common_voice_17_0數據集上微調的俄語自動語音識別(ASR)模型,詞錯誤率(WER)為0.195。
語音識別
Transformers

W
NLPVladimir
56
1
Whisper Hindi2Hinglish Swift
Apache-2.0
基於Whisper架構優化的印地語-印地英語混合語音識別模型,專為印度口音和噪聲環境優化
語音識別
Transformers 支持多種語言

W
Oriserve
496
6
Moonshine Base ONNX
MIT
基於Moonshine基礎模型的ONNX格式自動語音識別模型,支持高效推理
語音識別
Transformers

M
onnx-community
1,171
29
Whisper Large V3 Turbo Arabic
Apache-2.0
基於transformers庫,在common_voice_11_0數據集上對openai/whisper-large-v3-turbo進行微調後的版本,專為阿拉伯語語音識別優化。
語音識別
Transformers

W
mboushaba
1,696
1
Whisper Large V3 Turbo
基於ONNX格式優化的Whisper大型語音識別模型,專為網頁端部署設計
語音識別
Transformers

W
onnx-community
2,988
54
W2V2 BERT Withlm Malayalam
MIT
基於facebook/w2v-bert-2.0微調的馬拉雅拉姆語自動語音識別模型,在多個馬拉雅拉姆語數據集上訓練,並使用了KENLM庫訓練的三元語言模型。
語音識別
Transformers 其他

W
vrclc
65
3
Whisper Base
Whisper是一個自動語音識別(ASR)系統,由OpenAI訓練,支持多語言語音轉錄。
語音識別
Transformers

W
onnx-community
5,704
19
Faster Distil Whisper Large V3
MIT
Whisper Large v3的蒸餾版本,用於高效自動語音識別(ASR)
語音識別 英語
F
Systran
18.55k
49
Distil Whisper Large V3
Apache-2.0
該模型是從GGML格式的distil-whisper/distil-large-v3-ggml轉換至Ratchet自定義格式的版本,主要用於語音識別任務。
語音識別
D
FL33TW00D-HF
164
4
Whisper Tiny
Apache-2.0
這是將openai/whisper-tiny的GGML格式轉換為Ratchet自定義格式的版本
語音識別
W
FL33TW00D-HF
17.21k
5
Language Detector
Apache-2.0
基於openai/whisper-small微調的語言檢測模型,在評估集上準確率達96.47%
語音識別
Transformers

L
fitlemon
18
1
Audio Transcribe
這是一個基於Transformers的自動語音識別(ASR)模型,用於將音頻文件轉錄為文本。
語音識別
A
washeed
257
4
Audiosangraha Audio To Text
Apache-2.0
基於openai/whisper-small微調的語音轉文本模型,支持音頻翻譯和文本生成任務。
語音識別
Transformers

A
AqeelShafy7
224
4
Whisper Large V3 Ft Cv16 Mn
Apache-2.0
基於OpenAI Whisper Large V3模型在Common Voice 16.0數據集上微調的語音識別模型
語音識別
Transformers

W
sanchit-gandhi
34
1
Whisper Large V3
Whisper-large-v3是OpenAI開源的自動語音識別(ASR)模型,支持多種語言的語音轉文字任務。
語音識別
Transformers

W
Xenova
1,443
9
Speecht5 Tts Marathi
這是一個用於馬拉地語語音處理的模型,可能涉及語音識別或語音合成任務。
語音識別
Transformers

S
Patil
26
0
Whisper Large V2 Spanish
Apache-2.0
基於OpenAI Whisper-large-v2模型在Common Voice 13.0西班牙語數據集上微調的語音識別模型
語音識別
Transformers

W
Sandiago21
38
3
Whisper Medium
Whisper Medium 是 OpenAI 開發的中等規模語音識別模型,支持多種語言的自動語音識別(ASR)任務。
語音識別
Transformers

W
Xenova
871
4
Whisper Small
Whisper Small 是 OpenAI 開發的一個小型自動語音識別(ASR)模型,能夠將語音轉換為文本。
語音識別
Transformers

W
Xenova
1,716
9
Whisper Base
Whisper是一個自動語音識別(ASR)系統,由OpenAI訓練,支持多種語言的語音轉文本任務。
語音識別
Transformers

W
Xenova
6,204
7
Whisper Tiny
Whisper Tiny 是 OpenAI 開源的輕量級語音識別模型,適用於網頁端部署。
語音識別
Transformers

W
Xenova
21.70k
8
Faster Whisper Tiny
MIT
這是OpenAI Whisper-tiny模型的CTranslate2轉換版本,用於高效的語音識別任務。
語音識別 支持多種語言
F
guillaumekln
1,547
6
Speecht5 Asr
MIT
基於LibriSpeech數據集微調的SpeechT5自動語音識別模型,支持將語音轉換為文本。
語音識別
Transformers

S
microsoft
12.30k
41
Whisper Base
Apache-2.0
Whisper是一個預訓練的自動語音識別(ASR)和語音翻譯模型,經過68萬小時標註數據訓練,具有強大的泛化能力。
語音識別 支持多種語言
W
openai
491.35k
216
Wav2vec2 Large 960h Lv60 Self 4 Gram Fine Tune Real 29 Jun
Apache-2.0
該模型是基於facebook/wav2vec2-large-960h-lv60-self在uob_singlish數據集上微調的語音識別模型,支持新加坡英語識別。
語音識別
Transformers

W
RuiqianLi
105
0
Wav2vec2 Large Xls R 300m Bn Colab
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-300m在common_voice_9_0數據集上微調的語音識別模型,支持孟加拉語。
語音識別
Transformers

W
rhr99
18
0
Wav2vec2 Xls R 300m Mrbrown Finetune1
Apache-2.0
基於facebook/wav2vec2-xls-r-300m預訓練模型,使用uob_singlish數據集進行微調的語音識別模型
語音識別
Transformers

W
RuiqianLi
18
0
Wav2vec2 Large Multilang Cv Ru
Apache-2.0
該模型是基於facebook/wav2vec2-large-xlsr-53在common_voice數據集上微調的版本,主要用於俄語語音識別任務。
語音識別
Transformers

W
cutten
16
0
Wav2vec2 Large Xls R 300m Ta Colab
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-300m在common_voice數據集上微調的版本,主要用於泰米爾語的語音識別任務。
語音識別
Transformers

W
AAkhilesh
24
0
84rry Xlsr 53 Arabic
Apache-2.0
該模型是基於facebook/wav2vec2-large-xlsr-53在通用語音數據集上微調的阿拉伯語語音識別模型
語音識別
Transformers

8
84rry
24
0
Wav2vec2 Large Xls R 300m Turkish Colab Common Voice 8 6
Apache-2.0
這是一個基於wav2vec2架構的土耳其語語音識別模型,在common_voice數據集上微調得到
語音識別
Transformers

W
husnu
21
0
Wav2vec2 Large Xls R 300m Turkish Colab Common Voice 8 4
Apache-2.0
該模型是基於Facebook的wav2vec2-xls-r-300m模型,在common_voice土耳其語數據集上微調的語音識別模型。
語音識別
Transformers

W
husnu
19
0
Dansk Wav2vec21
Apache-2.0
該模型是基於Siyam/SKYLy在common_voice數據集上微調得到的丹麥語語音識別模型
語音識別
Transformers

D
Siyam
32
0
Wav2vec2 Vorarlbergerisch
Apache-2.0
基於facebook/wav2vec2-base-960h微調的德語方言語音識別模型,支持奧地利福拉爾貝格地區方言識別
語音識別
Transformers

W
bkh6722
21
0
Wav2vec2 Base MIR ST500 ASR 109
Apache-2.0
基於facebook/wav2vec2-base在MIR_ST500數據集上微調的自動語音識別模型
語音識別
Transformers

W
gary109
15
0
Wav2vec2 Large Xls R 300m Turkish Colab
Apache-2.0
這是一個基於Facebook的wav2vec2-xls-r-300m模型在通用語音數據集上微調的土耳其語語音識別模型。
語音識別
Transformers

W
jekdoieao
30
0
2nd Wav2vec2 L Xls R 300m Turkish Test
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-300m在common_voice土耳其語數據集上微調的語音識別模型,在評估集上取得了0.4444的詞錯誤率。
語音識別
Transformers

2
Khalsuu
29
0
Wav2vec2 Large Xls R 300m Turkish Colab
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-300m在common_voice土耳其語數據集上微調的語音識別模型,在評估集上取得了30.95%的詞錯誤率。
語音識別
Transformers

W
dennisowusuk
15
0
Wav2vec2 Common Voice Accents Scotland
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-300m在common_voice數據集上微調的版本,專注於蘇格蘭口音的語音識別。
語音識別
Transformers

W
willcai
19
0
- 1
- 2
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98