# 中国語音声認識

Belle Whisper Large V3 Turbo Zh Ct2
Apache-2.0
これはBELLE-2/Belle-whisper-large-v3-turbo-zhモデルのCTranslate2形式変換バージョンで、効率的な音声認識タスクに適しています。
音声認識
B
flateon
32
2
Belle Whisper Large V3 Turbo Zh
Apache-2.0
whisper-large-v3-turboを基に中国語音声認識向けに微調整したモデルで、複数の中国語音声認識ベンチマークテストで性能が大幅に向上
音声認識 Transformers
B
BELLE-2
2,891
55
Whisper Tiny Chinese
Apache-2.0
OpenAI Whisper TinyモデルをCommon Voice 11.0中国語データセットでファインチューニングした音声認識モデル
音声認識 Transformers 中国語
W
jethrowang
99
1
Belle Whisper Large V3 Zh
Apache-2.0
whisper-large-v3を微調整して最適化した中国語音声認識モデルで、複数の中国語音声ベンチマークテストで性能が大幅に向上
音声認識 Transformers
B
BELLE-2
1,666
112
Belle Distilwhisper Large V2 Zh
Apache-2.0
distilwhisper-large-v2を微調整した中国語音声認識モデルで、whisper-large-v2の5.8倍の速度で、パラメータが51%削減されています
音声認識 Transformers
B
BELLE-2
230
37
Belle Whisper Large V2 Zh
Apache-2.0
whisper-large-v2を微調整した中国語音声認識モデルで、複数の中国語音声認識ベンチマークテストにおいて30-70%の相対的性能向上を実現しました。
音声認識 Transformers
B
BELLE-2
140
33
Asr Wav2vec2 Commonvoice 14 Zh CN
Apache-2.0
これはCommonVoice中国語データセットでトレーニングされたエンドツーエンドの自動音声認識システムで、wav2vec2.0とCTCアーキテクチャを使用し、中国語音声認識をサポートします。
音声認識 中国語
A
speechbrain
36
9
Faster Whisper Large Zh Cv11
これはjonatasgrosman/whisper-large-zh-cv11モデルのCTranslate2変換バージョンで、効率的な音声認識タスク向けに最適化されており、特に中国語音声認識能力が強化されています。
音声認識 中国語
F
arc-r
22
9
Whisper Tiny Zh
Apache-2.0
openai/whisper-tinyをファインチューニングした中国語音声認識モデル、Common Voice 11.0中国語データセットでトレーニング
音声認識 Transformers 中国語
W
xmzhu
245
10
Whisper Large Zh Cv11
Apache-2.0
openai/whisper-large-v2をベースに、中国語(北京語)向けにCommon Voice 11データセットでファインチューニングした音声認識モデル
音声認識 Transformers 中国語
W
jonatasgrosman
145
76
Whisper Small Chinese Base
Apache-2.0
openai/whisper-smallをgoogle/fleurs cmn_hans_cnデータセットで微調整した中国語音声認識モデル
音声認識 Transformers
W
Jingmiao
117
23
Wav2vec2 Large Chinese Zh Cn
Apache-2.0
XLSR-53大規模モデルをファインチューニングした中国語音声認識モデル、16kHzサンプリングレートの音声入力をサポート
音声認識 Transformers 中国語
W
wbbbbb
585
40
Exp W2v2t Zh Cn Wavlm S596
Apache-2.0
microsoft/wavlm-largeモデルを基にファインチューニングした中国語音声認識モデルで、簡体字中国語をサポートし、Common Voice 7.0 (zh-CN)データセットでトレーニングされています。
音声認識 Transformers
E
jonatasgrosman
22
1
Stt Zh Citrinet 1024 Gamma 0 25
これは中国語普通話の自動音声認識(ASR)用の非自己回帰Citrinetモデルで、約1.4億のパラメータを持ち、文字エンコーディングスキームとCTC損失/デコードを採用しています。
音声認識 中国語
S
nvidia
92
5
Wav2vec2 Large Xlsr 53 Chinese Zn Cn Aishell1
Apache-2.0
facebook/wav2vec2-large-xlsr-53をベースに中国語AISHELL-1データセットでファインチューニングした音声認識モデルで、中国語音声認識タスクをサポートします。
音声認識 Transformers 中国語
W
qinyue
22
6
Wav2vec2 Base MIR ST500 ASR 109
Apache-2.0
facebook/wav2vec2-baseをベースにMIR_ST500データセットでファインチューニングした自動音声認識モデル
音声認識 Transformers
W
gary109
15
0
Wav2vec2 Large Xlsr 53 Chinese Zh Cn Gpt
Apache-2.0
facebook/wav2vec2-large-xlsr-53をベースに中国語(zh-CN)でCommon Voiceデータセットを使用してファインチューニングした音声認識モデル
音声認識 Transformers 中国語
W
ydshieh
127
32
Wav2vec2 Large Xlsr 53 Chinese Zh Cn
Apache-2.0
facebook/wav2vec2-large-xlsr-53モデルをファインチューニングした中国語音声認識モデルで、16kHzサンプリングレートの音声入力をサポートしています。
音声認識 中国語
W
jonatasgrosman
3.8M
110
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase