# 俄語語音識別

Stt Ru Fastconformer Hybrid Large Pc Onnx
NVIDIA FastConformer-Hybrid Large 是一個基於 FastConformer 架構的俄語自動語音識別模型,支持 CTC 和 RNN-T 解碼器。
語音識別
S
istupakov
163
1
Gigaam V2 Onnx
MIT
GigaAM v2 是一個自動語音識別(ASR)模型,支持俄語語音轉文本任務,提供CTC和RNN-T兩種架構。
語音識別 其他
G
istupakov
170
2
Gigaam Rnnt
MIT
GigaAM-v2-RNNT 是一個俄語自動語音識別(ASR)模型,基於RNNT架構,適用於語音轉文本任務。
語音識別 Transformers 其他
G
waveletdeboshir
70
1
Gigaam Ctc
MIT
GigaAM-v2-CTC 是一個俄語自動語音識別(ASR)模型,基於CTC損失函數訓練,可通過Hugging Face transformers庫使用。
語音識別 Transformers 其他
G
waveletdeboshir
255
1
Whisper Large V3 Russian Ties Podlodka V1.0
基於TIES合併方法融合的俄語語音識別模型,優化電話語音識別效果
語音識別 Transformers 其他
W
Apel-sin
96
1
Wav2vec2 Large Xls R 300m Ru
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-300m在common_voice_17_0數據集上微調的俄語自動語音識別(ASR)模型,詞錯誤率(WER)為0.195。
語音識別 Transformers
W
NLPVladimir
56
1
Whisper Large V3 Turbo Russian
MIT
基於OpenAI Whisper Large V3 Turbo優化的俄語自動語音識別(ASR)模型,使用Mozilla Common Voice 17俄語數據集微調
語音識別 Transformers 其他
W
dvislobokov
1,022
12
Faster Whisper Large V3 Ru Podlodka Int8
Apache-2.0
這是基於OpenAI Whisper架構的俄語語音識別模型,專為俄語語音轉文本任務優化,並轉換為ctranslate2格式以提高推理效率。
語音識別 其他
F
bzikst
29
3
Faster Whisper Large V3 Russian
Apache-2.0
這是antony66/whisper-large-v3-russian模型的ctranslate2轉換版本,針對俄語語音識別任務進行了優化。
語音識別 Transformers 其他
F
bzikst
155
3
Faster Whisper Large V3 Ru Podlodka
Apache-2.0
這是 bond005/whisper-large-v3-ru-podlodka 的 ctranslate2 轉換版本,針對俄語語音識別任務進行了優化。
語音識別 Transformers 其他
F
bzikst
23
1
Whisper Large V3 Russian
基於OpenAI Whisper-large-v3微調的俄語語音識別模型,針對俄語識別性能進行了優化
語音識別 Transformers 其他
W
antony66
6,665
60
Whisper Large V3 Ru Podlodka
Apache-2.0
這是一個基於Whisper Large V3的俄語語音識別模型,專門針對俄語語音進行了優化。
語音識別 Transformers 其他
W
bond005
570
8
Whisper Tiny Ru
Apache-2.0
本模型是基於openai/whisper-tiny在Common Voice 14.0數據集上微調的俄語自動語音識別模型
語音識別 Transformers
W
whitemouse84
333
1
Ru Whisper Small
Apache-2.0
基於openai/whisper-small微調的俄語語音識別模型,在Sberdevices_golos_10h_crowd數據集上訓練
語音識別 Transformers 其他
R
Val123val
43
1
Training V2
Apache-2.0
基於OpenAI Whisper-base模型在Common Voice 11.0俄語數據集上微調的語音識別模型
語音識別 Transformers 其他
T
SofiaK
15
1
Stt Ru Fastconformer Hybrid Large Pc
這是一個用於俄語自動語音識別的FastConformer混合模型,結合了Transducer和CTC解碼器,參數規模約1.15億。
語音識別 其他
S
nvidia
6,513
10
Stt Ru Conformer Ctc Large
這是一個用於俄語自動語音識別的大型Conformer-CTC模型,在約1636小時的俄語語音數據上訓練,具有約1.2億參數。
語音識別 其他
S
nvidia
452
5
Wav2vec2 Large Ru Golos With Lm
Apache-2.0
這是一個基於facebook/wav2vec2-large-xlsr-53微調的俄語語音識別模型,使用Sberdevices Golos數據集訓練,並集成了2-gram語言模型以提高識別準確率。
語音識別 Transformers 其他
W
bond005
434
15
Wav2vec2 Large Ru Golos
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53微調的俄語語音識別模型,使用Sberdevices Golos數據集訓練,支持16kHz音頻輸入
語音識別 Transformers 其他
W
bond005
1,182
12
Wav2vec2 Large Multilang Cv Ru
Apache-2.0
該模型是基於facebook/wav2vec2-large-xlsr-53在common_voice數據集上微調的版本,主要用於俄語語音識別任務。
語音識別 Transformers
W
cutten
16
0
Wav2vec2 Large Xls R 300m Russian Colab Beam Search Test
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-300m在通用語音數據集上微調的俄語語音識別模型,在評估集上取得了0.468的詞錯誤率。
語音識別 Transformers
W
jfealko
18
0
Wav2vec2 Russian
基於wav2vec2架構的俄語語音識別模型,識別結果可通過配套文本糾錯網絡進行後處理
語音識別 Transformers
W
UrukHan
100
8
Wav2vec2 Xls R 1b Russian
Apache-2.0
基於XLS-R 1B架構微調的俄語語音識別模型,在Common Voice 8.0等數據集上訓練
語音識別 Transformers 其他
W
jonatasgrosman
765
14
Wav2vec2 Large Xls R 300m Ru
這是一個基於Wav2Vec2 XLS-R架構的俄語自動語音識別模型,參數規模為300m,在公共語音和魯棒語音事件數據集上進行了評估。
語音識別 Transformers 其他
W
mobedkova
37
1
Wav2vec2 Large Xlsr 53 Russian
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53模型微調的俄語語音識別模型,支持16kHz採樣率的語音輸入
語音識別 其他
W
jonatasgrosman
3.9M
54
Wav2vec2 Large Xlsr 53 Russian
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53模型微調的俄語自動語音識別(ASR)模型,在Common Voice俄語數據集上達到17.39%的詞錯誤率(WER)。
語音識別 其他
W
anton-l
735
4
Wav2vec2 Large 100k Voxpopuli Ft Common Voice Plus TTS Dataset Plus Data Augmentation Russian
Apache-2.0
基於Facebook的Wav2vec2 Large 100k Voxpopuli模型,使用Common Voice 7.0、M-AILABS數據集及數據增強技術在俄語上進行微調的語音識別模型。
語音識別 Transformers 其他
W
Edresson
23
2
Wav2vec2 Large 100k Voxpopuli Ft Common Voice Plus TTS Dataset Russian
Apache-2.0
這是一個基於Facebook的wav2vec2-large-100k-voxpopuli模型,使用Common Voice 7.0和M-AILABS俄語數據進行微調的語音識別模型。
語音識別 Transformers 其他
W
Edresson
25
6
Wav2vec2 Base Russian Big Kaggle
Apache-2.0
該模型是基於facebook/wav2vec2-base在俄語數據集上微調的語音識別模型
語音識別 Transformers
W
Eyvaz
17
1
Wav2vec2 Xlsr 1b Ru
基於facebook/wav2vec2-xls-r-1b在Common Voice數據集上微調的俄語自動語音識別模型
語音識別 Transformers 其他
W
RASMUS
41
2
Wav2vec2 Base Russian Modified Kaggle
Apache-2.0
該模型是基於facebook/wav2vec2-base在未知數據集上微調的版本,適用於俄語語音處理任務。
語音識別 Transformers
W
Eyvaz
16
1
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase