# 端到端語音轉文本

Faster Whisper Small.en
MIT
基於OpenAI Whisper small.en模型的CTranslate2轉換版本,用於高效語音識別
語音識別 英語
F
Systran
129.26k
4
Wav2vec2 Xls R 300m Mixed
基於Facebook的wav2vec2-xls-r-300m模型在混合語言數據集上微調的語音識別模型,支持馬來語、新加坡式英語和普通話。
語音識別 Transformers
W
mesolitica
10.07k
4
My Final Wav2vec2 Urdu Asr Project
這是一個基於wav2vec2架構的烏爾都語自動語音識別(ASR)模型,從頭開始訓練。
語音識別 Transformers
M
Raffay
24
0
Wav2vec2 Base 100h
Apache-2.0
Wav2Vec2基礎版是在16kHz採樣的Librispeech語音音頻上進行了100小時預訓練和微調的自動語音識別模型。
語音識別 Transformers 英語
W
facebook
4,380
6
S2t Wav2vec2 Large En Ar
MIT
基於Transformer的端到端語音翻譯模型,支持英語到阿拉伯語的語音轉文本翻譯
語音識別 Transformers 支持多種語言
S
facebook
62
7
S2t Small Covost2 En Ca St
MIT
這是一個基於Transformer的端到端語音翻譯模型,專門用於將英語語音翻譯成加泰羅尼亞語文本。
語音識別 Transformers 支持多種語言
S
facebook
15
0
Wav2vec2 Large Xlsr Georgian
Apache-2.0
這是一個基於facebook/wav2vec2-large-xlsr-53模型在格魯吉亞語上進行微調的自動語音識別(ASR)模型,使用Common Voice數據集訓練。
語音識別 其他
W
m3hrdadfi
66
5
Hindi Wav2vec2 Stt
一個基於Wav2Vec2架構的印地語語音識別模型,可直接將音頻轉錄為文本。
語音識別 Transformers
H
addy88
207
1
Wav2vec2 Large Xlsr 53 French
Apache-2.0
Facebook開發的基於Wav2Vec 2.0架構的大規模法語語音識別模型,支持自動語音轉文本任務
語音識別 法語
W
facebook
2,264
13
Wav2vec2 Large Xlsr Hindi Demo Colab
Apache-2.0
該模型是基於facebook/wav2vec2-large-xlsr-53在common_voice數據集上微調的版本,用於印地語語音識別任務。
語音識別 Transformers
W
nikhil6041
19
0
Wav2vec2 Xls R 300m Ab CV8
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-300m在common_voice數據集上微調的版本,用於阿布哈茲語的自動語音識別任務。
語音識別 Transformers 其他
W
emre
20
0
S2t Wav2vec2 Large En Tr
MIT
一個基於Transformer的端到端語音翻譯模型,用於英語到土耳其語的語音轉文本任務
語音識別 Transformers 支持多種語言
S
facebook
55
3
Asr Voxrex Bart Base
這是一個基於序列到序列架構的自動語音識別模型,能夠將語音轉換為文本。
語音識別 Transformers
A
KBLab
28
0
Wav2vec2 Large Xlsr 53 Lithuanian
Apache-2.0
基於Facebook的XLSR-53大模型微調的立陶宛語語音識別模型,在Common Voice數據集上訓練,測試WER為56.55%。
語音識別 其他
W
DeividasM
4,105
1
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase