# 日語語音識別

Japanese Hubert Base Phoneme Ctc
Apache-2.0
本模型是基於rinna/japanese-hubert-base通過CTC進行日語音素識別的微調模型,可有效提升日語語音識別的準確性。
語音識別 Transformers 日語
J
prj-beatrice
144
3
Parakeet Tdt Ctc 0.6b Ja
該模型是基於FastConformer架構的日語自動語音識別(ASR)模型,由NVIDIA開發並轉換為MLX格式。
語音識別
P
mlx-community
368
1
Kotoba Whisper V2.2 Faster
MIT
這是一個基於Whisper架構的日語自動語音識別(ASR)模型,已轉換為CTranslate2格式以提高推理效率。
語音識別 日語
K
RoachLin
99
1
Vlzcrz Whisper Small Japanese 2
Apache-2.0
基於openai/whisper-small在Common Voice 17.0數據集上微調的日語語音識別模型
語音識別 Transformers 日語
V
vlzcrz
28
1
Japanese Wav2vec2 Large Rs35kh
Apache-2.0
基於wav2vec 2.0 Large架構,在大型日語ASR語料庫ReazonSpeech v2.0上微調而成的日語自動語音識別模型
語音識別 Transformers 日語
J
reazon-research
244
1
Kotoba Whisper V2.2
Apache-2.0
基於Whisper的日語自動語音識別模型,集成說話人分離和標點符號添加功能
語音識別 Transformers 日語
K
kotoba-tech
22.80k
47
Kotoba Whisper V2.0 Faster
MIT
適用於CTranslate2的Whisper語音識別模型,專為日語優化,提供高效的語音轉文本功能。
語音識別 日語
K
kotoba-tech
202
14
Kotoba Whisper V2.1
Apache-2.0
Kotoba-Whisper-v2.1 是一款基於 Whisper 的日語自動語音識別(ASR)模型,集成了額外的後處理棧,能夠自動添加標點符號。
語音識別 Transformers 日語
K
kotoba-tech
2,589
16
Kotoba Whisper V2.0
Apache-2.0
Kotoba-Whisper是由Asahi Ushio與Kotoba Technologies合作開發的日語自動語音識別蒸餾模型,基於Whisper large-v3蒸餾而來,推理速度提升6.3倍。
語音識別 Transformers 日語
K
kotoba-tech
8,108
60
Japanese Wav2vec2 Base Rs35kh
Apache-2.0
基於大規模日語自動語音識別語料庫ReazonSpeech v2.0微調的wav2vec 2.0 Base模型,適用於日語自動語音識別任務。
語音識別 Transformers 日語
J
reazon-research
3,968
1
Parakeet Tdt Ctc 0.6b Ja
Parakeet TDT-CTC 0.6B是一個能夠轉錄帶標點符號的日語語音的自動語音識別(ASR)模型,由NVIDIA NeMo團隊開發。
語音識別 日語
P
nvidia
4,184
22
Kotoba Whisper V1.1
Apache-2.0
Kotoba-Whisper-v1.1是基於Whisper的日語自動語音識別模型,增加了標點符號和時間戳處理功能。
語音識別 Transformers 日語
K
kotoba-tech
476
33
Wav2vec2 Base Japanese Asr
Apache-2.0
基於rinna/japanese-wav2vec2-base在common_voice_11_0日語數據集上微調的語音識別模型,僅支持平假名輸出
語音識別 Transformers 日語
W
TKU410410103
68
3
Kotoba Whisper V1.0
Apache-2.0
Kotoba-Whisper 是由 Asahi Ushio 和 Kotoba Technologies 合作開發的日語自動語音識別蒸餾版 Whisper 模型集合,比原版 large-v3 快 6.3 倍,同時保持相近的低錯誤率。
語音識別 Transformers 日語
K
kotoba-tech
2,397
53
Whisper Large V3 Japanese 4k Steps
Apache-2.0
基於openai/whisper-large-v3在Common Voice 16.1日語數據集上微調的語音識別模型,訓練4000步
語音識別 Transformers 日語
W
drewschaub
94
4
Nue Asr
Apache-2.0
Nue ASR是一種端到端的日語語音識別模型,集成了預訓練的語音和語言模型,識別準確度高且速度快。
語音識別 Transformers 支持多種語言
N
rinna
722
24
Faster Whisper Large V2 Mix Jp
這是whisper-large-v2-mix-jp模型的CTranslate2轉換版本,適用於日語語音識別任務
語音識別 日語
F
arc-r
64
9
Faster Whisper Large V2 Japanese 5k Steps
MIT
基於Whisper Large V2模型的日語自動語音識別(ASR)模型,使用CTranslate2優化轉換,支持高效推理。
語音識別 Transformers 日語
F
zh-plus
280
18
Whisper Small Japanese
Apache-2.0
該模型是基於openai/whisper-small微調的日語語音識別模型,支持日語語音轉文本任務。
語音識別 Transformers 日語
W
Ivydata
356
5
Whisper Base Japanese
Apache-2.0
本模型使用Common Voice、JVS和JSUT數據集對openai/whisper-base進行日語微調,適用於日語語音識別任務。
語音識別 Transformers 日語
W
Ivydata
137
3
Wav2vec2 Large Xlsr 53 Japanese
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53微調的日語語音識別模型,支持16kHz採樣率音頻輸入
語音識別 Transformers 日語
W
Ivydata
19
4
Whisper Large V2 Mix Jp
Apache-2.0
基於OpenAI Whisper-large-v2模型在日語語音數據集上微調的自動語音識別(ASR)模型
語音識別 Transformers
W
vumichien
93
9
Whisper Medium Jp
Apache-2.0
基於openai/whisper-medium在common_voice_11_0數據集上微調的日語語音識別模型
語音識別 Transformers 日語
W
vumichien
4,542
25
Exp W2v2t Ja Vp It S544
Apache-2.0
基於facebook/wav2vec2-large-it-voxpopuli模型,使用Common Voice 7.0 (日語版)的訓練集進行語音識別微調的日語自動語音識別模型。
語音識別 Transformers 日語
E
jonatasgrosman
18
0
Exp W2v2t Ja Unispeech Sat S884
Apache-2.0
基於microsoft/unispeech-sat-large模型微調的日語自動語音識別模型,使用Common Voice 7.0日語數據集訓練。
語音識別 Transformers 日語
E
jonatasgrosman
19
0
Exp W2v2t Ja Wavlm S729
Apache-2.0
基於microsoft/wavlm-large模型微調的日語自動語音識別模型,使用Common Voice 7.0日語數據集訓練
語音識別 Transformers 日語
E
jonatasgrosman
15
2
Exp W2v2t Ja Unispeech S569
Apache-2.0
基於microsoft/unispeech-large-1500h-cv模型,使用Common Voice 7.0 (日語)數據集進行語音識別微調的日語自動語音識別模型
語音識別 Transformers 日語
E
jonatasgrosman
14
0
Exp W2v2t Ja Xlsr 53 S109
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53模型微調的日語自動語音識別模型,使用Common Voice 7.0日語數據集訓練
語音識別 Transformers 日語
E
jonatasgrosman
20
0
Wav2vec2 Large Xlsr Japanese Hiragana
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53模型微調的日語語音識別模型,支持平假名輸出
語音識別 Transformers 日語
W
vumichien
90
7
Wav2vec2 Large Xlsr Japanese 0325 1200
Apache-2.0
這是一個基於facebook/wav2vec2-large-xlsr-53模型在日語語音識別任務上微調的自動語音識別(ASR)模型。
語音識別 Transformers 日語
W
qqpann
14
0
Wav2vec2 Large Xlsr Japanese
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53在日語上的微調模型,支持日語語音識別任務。
語音識別 Transformers 日語
W
vumichien
214
5
W2v Hf Commonvoice From Xlsr53 Pretrain 0329UTC1500
基於facebook/wav2vec2-large-xlsr-53在Common Voice日語數據集上微調的語音識別模型
語音識別 Transformers
W
qqpann
15
0
Kan Bayashi Csj Asr Train Asr Transformer Raw Char Sp Valid.acc.ave
這是一個基於ESPnet框架訓練的日語自動語音識別(ASR)模型,使用CSJ數據集訓練,採用Transformer架構。
語音識別 日語
K
espnet
13
0
Wav2vec2 Xls R 1b Japanese
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-1b在公共日語語音數據集上進行微調的版本,支持日語自動語音識別任務。
語音識別 Transformers 日語
W
vumichien
50
2
Wav2vec2 Large Xlsr 53 Japanese
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53模型微調的日語語音識別模型,支持16kHz採樣率的語音輸入
語音識別 日語
W
jonatasgrosman
2.9M
33
Wav2vec2 Xls R 300m Japanese
Apache-2.0
這是一個基於facebook/wav2vec2-xls-r-300m微調的日語自動語音識別模型,專門用於將日語音頻轉錄為平假名文本。
語音識別 Transformers 日語
W
vitouphy
29
0
W2v Hf Jsut Xlsr53
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53模型,使用Common Voice和JSUT數據集對日語進行了微調的自動語音識別模型。
語音識別 Transformers 日語
W
qqpann
16
1
Wav2vec2 Live Japanese
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53微調的日語語音識別模型,支持平假名輸出
語音識別 Transformers 日語
W
ttop324
20
4
Wav2vec2 Large Japanese
基於facebook/wav2vec2-large-xlsr-53模型微調的日語語音識別模型,支持16kHz採樣率輸入
語音識別 日語
W
NTQAI
316
7
Wav2vec2 Xls R 300m Japanese
Apache-2.0
這是一個基於facebook/wav2vec2-xls-r-300m在日語Common Voice 8.0數據集上微調的自動語音識別(ASR)模型,支持日語語音轉文字功能。
語音識別 Transformers 日語
W
AndrewMcDowell
24
0
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase