日語語音識別

# 日語語音識別

Japanese Hubert Base Phoneme Ctc

本模型是基於rinna/japanese-hubert-base通過CTC進行日語音素識別的微調模型，可有效提升日語語音識別的準確性。

Transformers 日語

Parakeet Tdt Ctc 0.6b Ja

該模型是基於FastConformer架構的日語自動語音識別(ASR)模型，由NVIDIA開發並轉換為MLX格式。

Kotoba Whisper V2.2 Faster

這是一個基於Whisper架構的日語自動語音識別(ASR)模型，已轉換為CTranslate2格式以提高推理效率。

語音識別日語

Vlzcrz Whisper Small Japanese 2

基於openai/whisper-small在Common Voice 17.0數據集上微調的日語語音識別模型

Transformers 日語

Japanese Wav2vec2 Large Rs35kh

基於wav2vec 2.0 Large架構，在大型日語ASR語料庫ReazonSpeech v2.0上微調而成的日語自動語音識別模型

Transformers 日語

reazon-research

Kotoba Whisper V2.2

基於Whisper的日語自動語音識別模型，集成說話人分離和標點符號添加功能

Transformers 日語

Kotoba Whisper V2.0 Faster

適用於CTranslate2的Whisper語音識別模型，專為日語優化，提供高效的語音轉文本功能。

語音識別日語

Kotoba Whisper V2.1

Kotoba-Whisper-v2.1 是一款基於 Whisper 的日語自動語音識別（ASR）模型，集成了額外的後處理棧，能夠自動添加標點符號。

Transformers 日語

Kotoba Whisper V2.0

Kotoba-Whisper是由Asahi Ushio與Kotoba Technologies合作開發的日語自動語音識別蒸餾模型，基於Whisper large-v3蒸餾而來，推理速度提升6.3倍。

Transformers 日語

Japanese Wav2vec2 Base Rs35kh

基於大規模日語自動語音識別語料庫ReazonSpeech v2.0微調的wav2vec 2.0 Base模型，適用於日語自動語音識別任務。

Transformers 日語

reazon-research

Parakeet Tdt Ctc 0.6b Ja

Parakeet TDT-CTC 0.6B是一個能夠轉錄帶標點符號的日語語音的自動語音識別(ASR)模型，由NVIDIA NeMo團隊開發。

語音識別日語

Kotoba Whisper V1.1

Kotoba-Whisper-v1.1是基於Whisper的日語自動語音識別模型，增加了標點符號和時間戳處理功能。

Transformers 日語

Wav2vec2 Base Japanese Asr

基於rinna/japanese-wav2vec2-base在common_voice_11_0日語數據集上微調的語音識別模型，僅支持平假名輸出

Transformers 日語

Kotoba Whisper V1.0

Kotoba-Whisper 是由 Asahi Ushio 和 Kotoba Technologies 合作開發的日語自動語音識別蒸餾版 Whisper 模型集合，比原版 large-v3 快 6.3 倍，同時保持相近的低錯誤率。

Transformers 日語

Whisper Large V3 Japanese 4k Steps

基於openai/whisper-large-v3在Common Voice 16.1日語數據集上微調的語音識別模型，訓練4000步

Transformers 日語

Nue ASR是一種端到端的日語語音識別模型，集成了預訓練的語音和語言模型，識別準確度高且速度快。

Transformers 支持多種語言

Faster Whisper Large V2 Mix Jp

這是whisper-large-v2-mix-jp模型的CTranslate2轉換版本，適用於日語語音識別任務

語音識別日語

Faster Whisper Large V2 Japanese 5k Steps

基於Whisper Large V2模型的日語自動語音識別(ASR)模型，使用CTranslate2優化轉換，支持高效推理。

Transformers 日語

Whisper Small Japanese

該模型是基於openai/whisper-small微調的日語語音識別模型，支持日語語音轉文本任務。

Transformers 日語

Whisper Base Japanese

本模型使用Common Voice、JVS和JSUT數據集對openai/whisper-base進行日語微調，適用於日語語音識別任務。

Transformers 日語

Wav2vec2 Large Xlsr 53 Japanese

基於facebook/wav2vec2-large-xlsr-53微調的日語語音識別模型，支持16kHz採樣率音頻輸入

Transformers 日語

Whisper Large V2 Mix Jp

基於OpenAI Whisper-large-v2模型在日語語音數據集上微調的自動語音識別(ASR)模型

Whisper Medium Jp

基於openai/whisper-medium在common_voice_11_0數據集上微調的日語語音識別模型

Transformers 日語

Exp W2v2t Ja Vp It S544

基於facebook/wav2vec2-large-it-voxpopuli模型，使用Common Voice 7.0 (日語版)的訓練集進行語音識別微調的日語自動語音識別模型。

Transformers 日語

Exp W2v2t Ja Unispeech Sat S884

基於microsoft/unispeech-sat-large模型微調的日語自動語音識別模型，使用Common Voice 7.0日語數據集訓練。

Transformers 日語

Exp W2v2t Ja Wavlm S729

基於microsoft/wavlm-large模型微調的日語自動語音識別模型，使用Common Voice 7.0日語數據集訓練

Transformers 日語

Exp W2v2t Ja Unispeech S569

基於microsoft/unispeech-large-1500h-cv模型，使用Common Voice 7.0 (日語)數據集進行語音識別微調的日語自動語音識別模型

Transformers 日語

Exp W2v2t Ja Xlsr 53 S109

基於facebook/wav2vec2-large-xlsr-53模型微調的日語自動語音識別模型，使用Common Voice 7.0日語數據集訓練

Transformers 日語

Wav2vec2 Large Xlsr Japanese Hiragana

基於facebook/wav2vec2-large-xlsr-53模型微調的日語語音識別模型，支持平假名輸出

Transformers 日語

Wav2vec2 Large Xlsr Japanese 0325 1200

這是一個基於facebook/wav2vec2-large-xlsr-53模型在日語語音識別任務上微調的自動語音識別(ASR)模型。

Transformers 日語

Wav2vec2 Large Xlsr Japanese

基於facebook/wav2vec2-large-xlsr-53在日語上的微調模型，支持日語語音識別任務。

Transformers 日語

W2v Hf Commonvoice From Xlsr53 Pretrain 0329UTC1500

基於facebook/wav2vec2-large-xlsr-53在Common Voice日語數據集上微調的語音識別模型

Kan Bayashi Csj Asr Train Asr Transformer Raw Char Sp Valid.acc.ave

這是一個基於ESPnet框架訓練的日語自動語音識別(ASR)模型，使用CSJ數據集訓練，採用Transformer架構。

語音識別日語

Wav2vec2 Xls R 1b Japanese

該模型是基於facebook/wav2vec2-xls-r-1b在公共日語語音數據集上進行微調的版本，支持日語自動語音識別任務。

Transformers 日語

Wav2vec2 Large Xlsr 53 Japanese

基於facebook/wav2vec2-large-xlsr-53模型微調的日語語音識別模型，支持16kHz採樣率的語音輸入

語音識別日語

Wav2vec2 Xls R 300m Japanese

這是一個基於facebook/wav2vec2-xls-r-300m微調的日語自動語音識別模型，專門用於將日語音頻轉錄為平假名文本。

Transformers 日語

W2v Hf Jsut Xlsr53

基於facebook/wav2vec2-large-xlsr-53模型，使用Common Voice和JSUT數據集對日語進行了微調的自動語音識別模型。

Transformers 日語

Wav2vec2 Live Japanese

基於facebook/wav2vec2-large-xlsr-53微調的日語語音識別模型，支持平假名輸出

Transformers 日語

Wav2vec2 Large Japanese

基於facebook/wav2vec2-large-xlsr-53模型微調的日語語音識別模型，支持16kHz採樣率輸入

語音識別日語

Wav2vec2 Xls R 300m Japanese

這是一個基於facebook/wav2vec2-xls-r-300m在日語Common Voice 8.0數據集上微調的自動語音識別(ASR)模型，支持日語語音轉文字功能。

Transformers 日語

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase