# 広東語音声認識

Whisper Large V3 Cantonese
Apache-2.0
Whisper v3を微調整した広東語自動音声認識モデル、Common Voice 17データセットで訓練
音声認識 Transformers その他
W
khleeloo
25
4
Distil Whisper Small Cantonese
Apache-2.0
これはWhisper Smallをベースにした広東語音声認識蒸留モデルで、Common Voice 16.0で9.7のCER(句読点なし)を達成しました。
音声認識 Transformers 中国語
D
alvanlii
187
7
Whisper Large V2 Cantonese
Apache-2.0
OpenAI Whisper Large V2モデルを微調整した広東語自動音声認識(ASR)モデルで、Common Voice 11.0広東語データセットで訓練され、文字誤り率(CER)は6.21%です。
音声認識 Transformers その他
W
Scrya
210
7
Whisper Large V2 Cantonese
Apache-2.0
OpenAI Whisper Large V2を広東語データセットでファインチューニングした自動音声認識モデルで、テストセットで6.7274%の文字誤り率を達成
音声認識 Transformers その他
W
simonl0909
131
12
Whisper Small Cantonese
Apache-2.0
OpenAI Whisper-smallをファインチューニングした広東語音声認識モデル、Common Voice 16.0テストセットでCER7.93を達成
音声認識 Transformers 複数言語対応
W
alvanlii
2,413
85
Wav2vec2 Large Xlsr 53 Cantonese
Apache-2.0
facebook/wav2vec2-large-xlsr-53モデルをベースに、Common Voiceコーパス8.0版で広東語にファインチューニングした音声認識モデル
音声認識 Transformers その他
W
CAiRE
1,214
3
Wav2vec2 Large Xlsr Cantonese
Apache-2.0
Facebookのwav2vec2-large-xlsr-53モデルをファインチューニングした広東語音声認識モデルで、16kHzサンプリングレートの音声入力をサポートします。
音声認識 その他
W
ctl
1,010
12
Wav2vec2 Large Xls R 300m Cantonese
Apache-2.0
これはfacebook/wav2vec2-xls-r-300mモデルを広東語(香港)データセットでファインチューニングした自動音声認識(ASR)モデルで、広東語音声認識タスク専用に設計されています。
音声認識 Transformers 中国語
W
ivanlau
42
1
Wav2vec2 Xls R 300m Zh HK V2
Apache-2.0
XLS-Rアーキテクチャに基づく広東語自動音声認識モデル、Common Voice広東語データセットでファインチューニング
音声認識 Transformers
W
w11wo
23
0
Wav2vec2 Large Xlsr 53 Hk
Apache-2.0
facebook/wav2vec2-large-xlsr-53を広東語(Common Voiceデータセット使用)でファインチューニングした音声認識モデル
音声認識 Transformers
W
voidful
26
2
Wav2vec2 Xls R 300m Zh HK Lm V2
Apache-2.0
XLS-Rアーキテクチャに基づく自動音声認識モデルで、広東語(zh-HK)向けに最適化され、Common Voiceデータセットで微調整され、5-gram言語モデルが追加されています。
音声認識 Transformers
W
w11wo
25
0
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase