# 低WERモデル

Distil Whisper Large V3 Ptbr
MIT
これはdistil-whisper-large-v3の微調整バージョンで、ブラジルポルトガル語の自動音声認識(ASR)に特化しており、Common Voice 16データセットと私有データセットを組み合わせて訓練されています。
音声認識 Safetensors
D
freds0
580
5
Ascend With English
timit_asrデータセットを使用してascendモデルをファインチューニングした英語音声認識モデル
音声認識 Transformers
A
GleamEyeBeast
23
0
Xls R 300m Sv Robust
これはKBLab/wav2vec2-large-voxrexを基に、スウェーデン語Common Voiceデータセットでファインチューニングした自動音声認識モデルです
音声認識 Transformers その他
X
marinone94
27
1
Wav2vec2 Large Xlsr Mr 2
Apache-2.0
これはfacebook/wav2vec2-large-xlsr-53モデルを基に、マラーティー語でファインチューニングした自動音声認識(ASR)モデルで、InterSpeech 2021マラーティー語データセットの一部を使用してトレーニングされました。
音声認識 その他
W
gchhablani
13
0
Unispeech Large 1500h Cv Timit
このモデルはmicrosoft/unispeech-large-1500h-cvをTIMIT_ASRデータセットでファインチューニングした自動音声認識モデルで、評価セットで21.96%の単語誤り率(WER)を達成しました。
音声認識 Transformers
U
patrickvonplaten
536
0
Xlsr Indonesia
Apache-2.0
XLSRアーキテクチャを基にファインチューニングしたインドネシア語自動音声認識(ASR)モデル、Common Voiceインドネシア語データセットでトレーニング
音声認識 Transformers その他
X
acul3
23
0
Wav2vec2 Large Xlsr 53 Eu
Apache-2.0
facebook/wav2vec2-large-xlsr-53モデルを基に、Common Voiceデータセットでバスク語にファインチューニングした音声認識モデルです。
音声認識 Transformers
W
enterprise-explorers
2,758
0
Xls R 300m It Phoneme
facebook/wav2vec2-xls-r-300mをイタリア語データセットでファインチューニングした音声認識モデル
音声認識 Transformers
X
patrickvonplaten
17
1
Bp500 Base10k Voxpopuli
Apache-2.0
これはブラジルポルトガル語に最適化されたWav2vec 2.0音声認識モデルで、複数のブラジルポルトガル語データセットでファインチューニングされています
音声認識 Transformers その他
B
lgris
23
0
Wav2vec2 Large Xlsr Indonesian
Apache-2.0
facebook/wav2vec2-large-xlsr-53をベースに微調整されたインドネシア語自動音声認識モデルで、Common Voiceインドネシア語データセットで訓練され、テストのWERは25.86%です。
音声認識 その他
W
cahya
74
0
Wav2vec2 Large Xlsr Gl
Facebookのwav2vec2-large-xlsr-53モデルをファインチューニングしたガリシア語自動音声認識(ASR)モデルで、OpenSLR 77データセットで16.79%のWERを達成
音声認識
W
diego-fustes
2,264
0
Xls R 300m Es
Apache-2.0
スペイン語Common Voiceデータセットでファインチューニングされた音声認識モデル。facebook/wav2vec2-xls-r-300mアーキテクチャ採用。テストセットでWER14.6%を達成
音声認識 Transformers スペイン語
X
polodealvarado
23
4
Wav2vec2 Large Xlsr 53 Turkish
Apache-2.0
これはFacebookのwav2vec2-large-xlsr-53モデルをトルコ語Common Voiceデータセットでファインチューニングした自動音声認識モデルです。
音声認識 その他
W
dundar
23
1
Hindi Base Wav2vec2
Apache-2.0
これはwav2vec2アーキテクチャに基づくヒンディー語の自動音声認識(ASR)モデルで、Common Voiceなどのデータセットで訓練されています。
音声認識 Transformers その他
H
Harveenchadha
49
2
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase