# 低CER最適化

Wav2vec2 Base Japanese Asr
Apache-2.0
rinna/japanese-wav2vec2-baseをcommon_voice_11_0日本語データセットでファインチューニングした音声認識モデル、ひらがな出力のみ対応
音声認識 Transformers 日本語
W
TKU410410103
68
3
Wav2vec2 Large Chinese Zh Cn
Apache-2.0
XLSR-53大規模モデルをファインチューニングした中国語音声認識モデル、16kHzサンプリングレートの音声入力をサポート
音声認識 Transformers 中国語
W
wbbbbb
585
40
Wav2vec2 Large Ru Golos
Apache-2.0
facebook/wav2vec2-large-xlsr-53をファインチューニングしたロシア語音声認識モデル。Sberdevices Golosデータセットでトレーニングされ、16kHz音声入力をサポート
音声認識 Transformers その他
W
bond005
1,182
12
Wav2vec2 Large Xlsr 53 Finnish
Apache-2.0
XLSR-53大規模モデルをファインチューニングしたフィンランド語音声認識モデル、16kHz音声入力に対応
音声認識 その他
W
jonatasgrosman
73.11k
1
W2v Hf Jsut Xlsr53
Apache-2.0
facebook/wav2vec2-large-xlsr-53モデルをベースに、Common VoiceとJSUTデータセットを使用して日本語にファインチューニングした自動音声認識モデルです。
音声認識 Transformers 日本語
W
qqpann
16
1
Wav2vec2 Large Xlsr 53 Tw Gpt
Apache-2.0
facebook/wav2vec2-large-xlsr-53を台湾華語(zh-tw)でファインチューニングした音声認識モデル、16kHzサンプリングレートの音声入力をサポート
音声認識 Transformers
W
voidful
47
3
Wav2vec2 Xls R 300m Korean
Apache-2.0
XLS-Rアーキテクチャに基づく韓国語自動音声認識モデル、Zeroth Koreanデータセットでファインチューニング済み
音声認識 Transformers 韓国語
W
w11wo
152
6
Wav2vec2 Large Xlsr 53 Chinese Zh Cn
Apache-2.0
facebook/wav2vec2-large-xlsr-53モデルをファインチューニングした中国語音声認識モデルで、16kHzサンプリングレートの音声入力をサポートしています。
音声認識 中国語
W
jonatasgrosman
3.8M
110
Wav2vec2 Xls R 300m Korean Lm
Apache-2.0
XLS-Rアーキテクチャに基づく韓国語自動音声認識モデルで、Zeroth韓国語データセットで微調整され、5-gram言語モデルが追加されています
音声認識 Transformers 韓国語
W
w11wo
23
1
Wav2vec2 Large Xlsr Japanese
Apache-2.0
facebook/wav2vec2-large-xlsr-53を日本語用にファインチューニングしたモデルで、日本語音声認識タスクをサポートします。
音声認識 Transformers 日本語
W
vumichien
214
5
Wav2vec2 Xls R 300m Zh HK Lm V2
Apache-2.0
XLS-Rアーキテクチャに基づく自動音声認識モデルで、広東語(zh-HK)向けに最適化され、Common Voiceデータセットで微調整され、5-gram言語モデルが追加されています。
音声認識 Transformers
W
w11wo
25
0
Wav2vec2 Xls R 300m Japanese
Apache-2.0
これはfacebook/wav2vec2-xls-r-300mをファインチューニングした日本語自動音声認識モデルで、日本語の音声を平仮名テキストに転写するために特化しています。
音声認識 Transformers 日本語
W
vitouphy
29
0
Wav2vec2 Large Japanese
facebook/wav2vec2-large-xlsr-53モデルを微調整した日本語音声認識モデルで、16kHzサンプリングレートの入力をサポートします。
音声認識 日本語
W
NTQAI
316
7
Wav2vec2 Xls R 300m Japanese
Apache-2.0
これはfacebook/wav2vec2 - xls - r - 300mをベースに、日本語Common Voice 8.0データセットで微調整された自動音声認識(ASR)モデルで、日本語の音声を文字に変換する機能をサポートしています。
音声認識 Transformers 日本語
W
AndrewMcDowell
24
0
Wav2vec2 Xls R 300m German De
Apache-2.0
このモデルは、facebook/wav2vec2 - xls - r - 300mをベースに、MOZILLA - FOUNDATION/COMMON_VOICE_7_0 - DEデータセットで微調整されたドイツ語自動音声認識モデルです。
音声認識 Transformers ドイツ語
W
AndrewMcDowell
72
3
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase