# 多場景轉錄

Nextvoice
Apache-2.0
NextVoice是由Lamapi開發的開源語音轉文字解決方案,支持高質量轉錄和即時處理。
語音識別 Transformers 其他
N
Lamapi
18
1
Vlzcrz Whisper Small Japanese 2
Apache-2.0
基於openai/whisper-small在Common Voice 17.0數據集上微調的日語語音識別模型
語音識別 Transformers 日語
V
vlzcrz
28
1
Whisper Large V3 Turbo German
Apache-2.0
基於 Whisper Large v3 的德語語音識別微調模型,專門針對德語語音處理和識別進行了優化。
語音識別 Transformers 德語
W
primeline
2,777
33
Whisper Large V2 Spanish
Apache-2.0
基於openai/whisper-large-v2微調的西班牙語語音識別模型,在Common Voice 11.0西班牙語測試集上WER為8.55%
語音識別 Transformers
W
clu-ling
85
2
Whisper Medium Portuguese
Apache-2.0
基於openai/whisper-medium在common_voice_11_0數據集上微調的葡萄牙語語音識別模型,詞錯誤率6.5987
語音識別 Transformers 其他
W
pierreguillou
191
28
Whisper Small Spanish
Apache-2.0
該模型是基於OpenAI的whisper-small在Common Voice數據集v11西班牙語版本上微調的語音識別模型,專注於西班牙語轉錄任務。
語音識別 Transformers
W
clu-ling
298
1
Whisper Medium French
Apache-2.0
基於openai/whisper-medium在common_voice_11_0數據集上微調的法語語音識別模型,標準化WER達到11.1406,優於原版模型。
語音識別 Transformers 法語
W
pierreguillou
260
9
Stt Rw Conformer Transducer Large
這是一個用於盧旺達語語音識別的Conformer-Transducer大型模型,能將語音轉錄為小寫拉丁字母,支持空格和撇號。
語音識別 其他
S
nvidia
116
1
Wav2vec2 Base 10k Voxpopuli Ft Fr
基於Facebook Wav2Vec2架構的語音識別模型,使用VoxPopuli語料庫的10K未標記法語數據進行預訓練,並在法語轉錄數據上微調。
語音識別 Transformers 法語
W
facebook
75
0
Wav2vec2 Base 10k Voxpopuli Ft De
基於Facebook Wav2Vec2基礎模型,在VoxPopuli語料庫10K無標註子集上預訓練,並在德語轉錄數據上微調的語音識別模型
語音識別 Transformers 德語
W
facebook
46
1
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase