Whisper Large V3 Speech Flow
Apache-2.0
基於Whisper Large v3的語音流暢度分類模型,可檢測語音流暢度及不流暢類型
音頻分類
Safetensors 英語
W
tiantiaf
157
1
Kinyawhisper
MIT
KinyaWhisper是基於OpenAI Whisper模型微調的盧旺達語自動語音識別(ASR)系統,專為低資源土著語言設計。
語音識別
Transformers 其他

K
benax-rw
149
3
Whisper Small Ta
Apache-2.0
該模型是基於OpenAI的Whisper Small在泰米爾語Common Voice 17.0數據集上微調的語音識別模型,詞錯誤率(WER)為43.23%。
語音識別
Transformers 其他

W
navin-kumar-j
38
1
Indian Accent English Whisper Finetuned Epoch 15
MIT
基於OpenAI Whisper-large-v3-turbo微調的印度英語口音語音識別模型,在印度英語口音數據集上取得7.99%的詞錯誤率
語音識別
Transformers 英語

I
Tejveer12
21
2
Indian Accent English Whisper Finetuned
MIT
基於印度英語口音數據集對openai/whisper-large-v3-turbo進行微調,更適合印度英語口音的語音識別。
語音識別
Transformers 英語

I
Tejveer12
1,733
1
Whisper Finetuned
MIT
基於Whisper-large-v3-turbo微調的印度英語口音語音識別模型,詞錯誤率4.39%
語音識別
Transformers 英語

W
Tejveer12
25
2
Quran Whisper Base Fine Tune
Apache-2.0
該模型是基於openai/whisper-base在quran-ayat-speech-to-text數據集上微調的阿拉伯語語音識別模型,專注於古蘭經經文的語音轉文字任務。
語音識別
Transformers 阿拉伯語

Q
Baselhany
35
1
Whisper Base Pl
Apache-2.0
基於OpenAI Whisper-base模型在波蘭語Common Voice 17.0數據集上微調的語音識別模型
語音識別
Transformers 其他

W
marcsixtysix
27
1
Vlzcrz Whisper Small Japanese 2
Apache-2.0
基於openai/whisper-small在Common Voice 17.0數據集上微調的日語語音識別模型
語音識別
Transformers 日語

V
vlzcrz
28
1
Viwhisper Medium
MIT
針對越南語語音識別任務優化的Whisper-medium模型,在1308小時越南語數據上微調
語音識別
Transformers 其他

V
NhutP
139
4
Whisper Large V3 Cantonese
Apache-2.0
基於Whisper v3微調的粵語自動語音識別模型,在Common Voice 17數據集上訓練
語音識別
Transformers 其他

W
khleeloo
25
4
Voice Clone Large Finetune Final
Apache-2.0
該模型是基於openai/whisper-large-v3微調的語音克隆模型,主要用於語音識別任務,在評估集上詞錯誤率為15.3572。
語音識別
Transformers

V
neuronbit
37
2
Akan Whisper Model
基於OpenAI Whisper模型微調的版本,專為加納低資源語言阿坎語的自動語音識別任務設計
語音識別
Transformers 其他

A
GiftMark
354
3
Whisper Small Khmer
MIT
基於openai/whisper-small微調的語音識別模型,專門優化高棉語轉錄準確率
語音識別
Transformers 其他

W
Vira21
15
1
Speech Emotion Recognition With Openai Whisper Large V3
Apache-2.0
本項目利用Whisper模型實現語音情感識別,能夠將音頻分類為快樂、悲傷、驚訝等不同情感類別。
音頻分類
Transformers

S
firdhokk
7,750
33
Whisper Tiny De Emodb Emotion Classification
Apache-2.0
基於openai/whisper-tiny微調的德語情感分類模型,在Emo-DB數據集上達到91.59%準確率
音頻分類
Transformers 德語

W
Flocksserver
27
0
Whisper Tiny Myanmar
Apache-2.0
該模型是基於openai/whisper-tiny在緬甸語語音數據集上微調的自動語音識別(ASR)模型,支持緬甸語語音轉文本任務。
語音識別
Transformers 其他

W
chuuhtetnaing
84
1
Whisper Large V3 Myanmar
Apache-2.0
本模型是基於openai/whisper-large-v3在緬甸語語音數據集上微調的自動語音識別模型,專門用於緬甸語語音轉錄。
語音識別
Transformers 其他

W
chuuhtetnaing
172
1
Monsoon Whisper Medium Gigaspeech2
Apache-2.0
Monsoon-Whisper-Medium-GigaSpeech2 是一款泰語自動語音識別(ASR)模型,基於Whisper-Medium並在GigaSpeech2數據集上進行了微調,適用於真實場景下的語音識別。
語音識別
Transformers

M
scb10x
546
5
Akylai STT Small
Apache-2.0
吉爾吉斯語Whisper ASR是一款專為吉爾吉斯語定製的自動語音識別解決方案,基於預訓練的Whisper模型微調適配。
語音識別
Transformers 其他

A
the-cramer-project
73
1
Whisper Large V3 Taiwanese Hakka
基於Whisper-large-v3微調的臺灣客家話語音識別模型,支持多種客家話方言
語音識別
Transformers 其他

W
formospeech
41
5
Detect Language
Apache-2.0
基於Whisper Medium模型微調的語言識別模型,專門用於FLEURS數據集上的語言分類任務
音頻分類
Transformers

D
apparaomulpuriril
15
0
Whisper Sinhala Audio To Text
Apache-2.0
基於openai/whisper-small微調的僧伽羅語語音識別模型,支持將僧伽羅語語音轉換為文本。
語音識別
Transformers

W
AqeelShafy7
229
2
Pronunciation Accuracy
Apache-2.0
基於OpenAI Whisper-base微調的發音準確度評估模型,用於評估語音發音準確性
語音識別
Transformers

P
JohnJumon
18
2
Whisper Small Kyrgyz
基於Whisper架構的吉爾吉斯語自動語音識別(ASR)模型,由吉爾吉斯共和國總統下屬國家語言與語言政策全國委員會支持開發
語音識別
Transformers 其他

W
UlutSoftLLC
841
4
Whisper Tiny Vi
Apache-2.0
基於OpenAI Whisper-tiny架構微調的越南語自動語音識別(ASR)模型,在多個越南語數據集上表現出色
語音識別
Transformers 其他

W
doof-ferb
44
2
Phowhisper Medium
Bsd-3-clause
PhoWhisper 是一個專為越南語自動語音識別(ASR)設計的模型系列,通過在844小時越南語口音數據集上微調Whisper模型實現高魯棒性。
語音識別
Transformers 其他

P
vinai
2,999
10
Phowhisper Small
Bsd-3-clause
PhoWhisper是一個專為越南語自動語音識別設計的系統,基於Whisper模型微調,支持多種越南語口音。
語音識別
Transformers 其他

P
vinai
2,725
8
Whisper Large V3 Japanese 4k Steps
Apache-2.0
基於openai/whisper-large-v3在Common Voice 16.1日語數據集上微調的語音識別模型,訓練4000步
語音識別
Transformers 日語

W
drewschaub
94
4
Haitian Speech To Text
Apache-2.0
專為海地克里奧爾語優化的Whisper語音識別模型,具有高準確度的語音轉文本能力
語音識別
Transformers 其他

H
ZeeshanGeoPk
156
1
Audiosangraha Audio To Text
Apache-2.0
基於openai/whisper-small微調的語音轉文本模型,支持音頻翻譯和文本生成任務。
語音識別
Transformers

A
AqeelShafy7
224
4
Phowhisper Large
Bsd-3-clause
PhoWhisper是一個專為越南語自動語音識別設計的系統,基於Whisper模型微調,支持多種越南語口音。
語音識別
Transformers 其他

P
vinai
2,373
28
Whisper Large V3 Atco2 Asr
Apache-2.0
基於OpenAI Whisper-large-v3微調的語音識別模型,專注於航空交通管制(ATCO)場景,詞錯誤率17.04%
語音識別
Transformers

W
jlvdoorn
1,792
5
Whisper Small Fa
Hezar團隊基於Common Voice數據集的波斯語部分微調的Whisper (small) 模型,可用於自動語音識別任務。
語音識別 其他
W
hezarai
363
11
Whisper Large V2 Spanish
Apache-2.0
基於OpenAI Whisper-large-v2模型在Common Voice 13.0西班牙語數據集上微調的語音識別模型
語音識別
Transformers

W
Sandiago21
38
3
Asr Whisper Medium Commonvoice Fa
Apache-2.0
基於CommonVoice-14.0波斯語數據集微調的whisper medium模型,用於波斯語自動語音識別任務。
語音識別 其他
A
speechbrain
21
3
Whisper Small Keyword Spotting
Apache-2.0
基於openai/whisper-small微調的音頻關鍵詞識別模型,在kw-spotting-fsc-sl-agv數據集上訓練,評估準確率達99.98%
音頻分類
Transformers

W
FlandersMakeAGV
24
0
Banglaasr
MIT
這是一個基於Whisper small架構的孟加拉語自動語音識別模型,在約400小時的Mozilla Common Voice數據集上微調訓練,詞錯誤率4.58%
語音識別
Transformers

B
bangla-speech-processing
782
15
Whisper Base Japanese
Apache-2.0
本模型使用Common Voice、JVS和JSUT數據集對openai/whisper-base進行日語微調,適用於日語語音識別任務。
語音識別
Transformers 日語

W
Ivydata
137
3
Afrispeech Large A100
基於Whisper-large-v2微調的非洲語言語音識別模型,在afrispeech-200數據集上訓練,詞錯誤率(WER)為14.81
語音識別
Transformers

A
Seyfelislem
20
1
- 1
- 2
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98