# 低単語誤り率(WER)

Wav2vec2 Base Vietnamese 250h
wav2vec 2.0アーキテクチャに基づくベトナム語自動音声認識モデルで、13,000時間の未ラベル付きオーディオと250時間のラベル付きデータで訓練されています。
音声認識 Transformers その他
W
nguyenvulebinh
6,868
39
Wav2vec2 Large Xlsr Catala
Apache-2.0
facebook/wav2vec2-large-xlsr-53モデルをベースに微調整されたカタルーニャ語音声認識モデルで、一般音声データベースと議会音声データベースのデータで訓練されています。
音声認識 その他
W
softcatala
64.30k
0
Wav2vec2 Large Voxrex Swedish
VoxRex大型モデルを微調整したスウェーデン語自動音声認識モデルで、16kHzサンプリングレートの音声入力をサポートします。
音声認識 Transformers その他
W
KBLab
101.28k
12
Nb Wav2vec2 300m Nynorsk
Apache-2.0
VoxRex特徴抽出器をベースに微調整された3億パラメータの音声認識モデルで、ニューノルウェー語(Nynorsk)に最適化されており、NPSCテストセットでのWERは12.22%です。
音声認識 Transformers その他
N
NbAiLab
73.53k
0
Wav2vec2 Large Xlsr 53 Spanish
Apache-2.0
facebook/wav2vec2-large-xlsr-53モデルをベースに微調整されたスペイン語自動音声認識(ASR)モデルで、Common Voiceスペイン語データセットで訓練され、16kHzのサンプリングレートの音声入力をサポートします。
音声認識 スペイン語
W
LuisG07
50
0
Wav2vec2 Xls R 300m Rm Sursilv D11
Apache-2.0
このモデルは、facebook/wav2vec2-xls-r-300mをベースに、ロマンシュ語 - スルシルヴァ方言データセットで微調整された自動音声認識モデルです。Common Voice 8テストセットで24.09%の単語誤り率(WER)を達成しました。
音声認識 Transformers
W
DrishtiSharma
20
0
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase