# 低い単語誤り率

Ai Light Dance Singing Ft Wav2vec2 Large Xlsr 53
Apache-2.0
このモデルは、AI_LIGHT_DANCE - ONSET-SINGINGデータセットでfacebook/wav2vec2-large-xlsr-53をファインチューニングした自動音声認識モデルで、主に歌唱音声認識タスクに使用されます。
音声認識 Transformers
A
gary109
23
1
Hubert Base Librispeech Demo Colab
Apache-2.0
facebook/hubert-large-ls960-ftをファインチューニングした音声認識モデルで、LibriSpeechデータセットでトレーニング済み
音声認識 Transformers
H
vishwasgautam
101
0
Kb Whisper Small
Apache-2.0
スウェーデン国立図書館が公開したWhisperモデルで、スウェーデン語に最適化されており、50,000時間以上のスウェーデン語音声データでトレーニングされ、OpenAIのオリジナル版を上回る性能
音声認識 Transformers その他
K
KBLab
28.61k
3
Kb Whisper Medium
Apache-2.0
スウェーデン国立図書館が5万時間以上のスウェーデン語音声で訓練したWhisperモデルで、スウェーデン語音声認識タスクで優れた性能を発揮
音声認識 Transformers その他
K
KBLab
691
3
Kb Whisper Large
Apache-2.0
スウェーデン国立図書館が公開したWhisperアーキテクチャに基づくスウェーデン語音声認識モデルで、5万時間以上のトレーニングデータを使用し、単語誤り率を大幅に低減しています。
音声認識 Transformers その他
K
KBLab
8,880
42
German RAG WHISPER LARGE V3 TURBO HESSIAN AI
MIT
Whisper Large v3 Turboを基に最適化されたドイツ語音声認識モデル。13時間の精選データセットで微調整され、ドイツ語認識精度が大幅に向上
音声認識 Transformers ドイツ語
G
avemio
282
1
Whisper Uz
Apache-2.0
Whisper Baseをファインチューニングしたウズベク語音声認識モデル、Common Voiceデータセットでトレーニング済み
音声認識 Transformers その他
W
jamshidahmadov
1,179
3
Voice Clone Large Finetune Final
Apache-2.0
このモデルはopenai/whisper-large-v3を微調整した音声クローンモデルで、主に音声認識タスクに使用され、評価データセットでの単語誤り率は15.3572です。
音声認識 Transformers
V
neuronbit
37
2
Whisper Large V3 Turbo German Ct2
Apache-2.0
Whisper Large v3をベースとしたドイツ語音声認識モデル、ドイツ語音声処理と認識に最適化
音声認識 Transformers ドイツ語
W
jimmymeister
38
3
Whisper Base Hungarian V1
OpenAI Whisper-baseモデルをファインチューニングしたハンガリー語音声認識モデルで、1200時間のハンガリー語データで訓練され、同類のモデルよりも優れた性能を発揮します
音声認識 Transformers その他
W
sarpba
26
7
Whisper Large V3 Turbo Turkish
MIT
openai/whisper-large-v3-turboをCommon Voice 17.0データセットでファインチューニングしたトルコ語音声認識モデル
音声認識 Transformers その他
W
selimc
289
6
Whisper Large V3 Turbo German
Apache-2.0
Whisper Large v3を基にしたドイツ語音声認識のファインチューニングモデルで、ドイツ語音声処理と認識に特化して最適化されています。
音声認識 Transformers ドイツ語
W
primeline
2,777
33
Wav2vec2 Phoneme
Apache-2.0
facebook/wav2vec2-large-xlsr-53をファインチューニングした音声認識モデルで、音素認識タスクに特化
音声認識 Transformers
W
Bluecast
189
3
Whisper Native Elderly 9 Dutch
Apache-2.0
OpenAI Whisper Large V2モデルをオランダ語データセットで微調整した音声認識モデル、単語誤り率10.14%
音声認識 Transformers その他
W
golesheed
22
1
Whisper Large V3 Ft Cv16 Mn
Apache-2.0
Common Voice 16.0データセットで微調整されたOpenAI Whisper Large V3モデルに基づく音声認識モデル
音声認識 Transformers
W
sanchit-gandhi
34
1
Wav2vec2 Bert CV16 En
w2v-bert-2.0をベースに、Common Voice 16.0の英語データセットで微調整された自動音声認識(ASR)モデル
音声認識 Transformers 英語
W
hf-audio
1,700
8
Training V2
Apache-2.0
OpenAI Whisper-baseモデルをCommon Voice 11.0ロシア語データセットでファインチューニングした音声認識モデル
音声認識 Transformers その他
T
SofiaK
15
1
Whisper Small Turkish Tr Best
Apache-2.0
OpenAI Whisper-smallを微調整したトルコ語音声認識モデル、単語誤り率26.34%
音声認識 Transformers
W
erenfazlioglu
61
4
Asr Conformer Transformerlm Librispeech
Apache-2.0
SpeechBrainフレームワークに基づく自動音声認識モデルで、ConformerエンコーダーとTransformerデコーダーを使用し、LibriSpeechデータセットでトレーニングされ、英語音声認識をサポートします。
音声認識 英語
A
speechbrain
984
7
Git Base Pokemon
MIT
microsoft/git-baseをベースにファインチューニングした画像説明生成モデルで、ポケモン画像データセットでトレーニング
画像生成テキスト Transformers その他
G
jihwaneom
14
0
Whisper Medium Et
約800時間の多様なエストニア語データでファインチューニングされたWhisper-mediumモデルで、汎用音声認識シナリオに適しています
音声認識 Transformers
W
TalTechNLP
115
2
Whisper Large V2 Ko
Apache-2.0
OpenAI Whisper-large-v2をファインチューニングした韓国語自動音声認識(ASR)モデルで、韓国語データセットで優れた性能を発揮
音声認識 Transformers 韓国語
W
byoussef
94
22
Asr Whisper Large V2 Commonvoice Fa
Apache-2.0
これはwhisper-large-v2アーキテクチャに基づく自動音声認識モデルで、CommonVoiceデータセット上のペルシア語に特化して微調整されています。
音声認識 その他
A
speechbrain
103
15
Whisper Large V2 French
Apache-2.0
openai/whisper-large-v2を基にファインチューニングしたフランス語音声認識モデルで、2200時間以上のフランス語音声データでトレーニングされています
音声認識 Transformers フランス語
W
bofenghuang
103
14
Whisper Hindi Small
Apache-2.0
OpenAI Whisper-smallをファインチューニングしたヒンディー語音声認識モデルで、複数の公開ASRコーパスでトレーニング済み
音声認識 その他
W
vasista22
477
26
Whisper Tamil Small
Apache-2.0
OpenAI Whisper-smallを微調整したタミル語自動音声認識モデルで、複数の公開データセットで訓練され、単語誤り率の性能に優れています。
音声認識 その他
W
vasista22
10.78k
1
Whisper Medium Da
Apache-2.0
OpenAI Whisper Mediumモデルをファインチューニングしたデンマーク語自動音声認識(ASR)モデルで、Common Voice 11とFLEURSデータセットでトレーニング済み
音声認識 Transformers その他
W
jstoone
22
5
Whisper Telugu Medium
Apache-2.0
OpenAI Whisper-mediumをファインチューニングしたテルグ語音声認識モデルで、複数の公開テルグ語ASRデータセットでトレーニング済み
音声認識 その他
W
vasista22
228
2
Whisper Kannada Tiny
Apache-2.0
openai/whispertinyを微調整したカンナダ語自動音声認識モデルで、複数の公開カンナダ語ASRコーパスでトレーニング済み
音声認識 その他
W
vasista22
119
6
Whisper Large V2 Mix Jp
Apache-2.0
OpenAI Whisper-large-v2モデルを日本語音声データセットでファインチューニングした自動音声認識(ASR)モデル
音声認識 Transformers
W
vumichien
93
9
Whisper Large V2 Ta
Apache-2.0
OpenAI Whisper Large-v2モデルをファインチューニングしたタミル語自動音声認識(ASR)モデルで、Common Voice 11.0タミル語テストセットで8.45%の単語誤り率を達成
音声認識 Transformers その他
W
anuragshas
15
1
Whisper Large V2 Hi V3
Apache-2.0
OpenAI Whisper Large-v2モデルをファインチューニングしたヒンディー語音声認識モデルで、Common Voice 11.0ヒンディー語テストセットで11.3%の単語誤り率を達成
音声認識 Transformers その他
W
anuragshas
21
1
Whisper Small Ko Zeroth
Apache-2.0
Zeroth Koreanデータセットを基に微調整された韓国語自動音声認識モデルで、単語誤り率は6.76%です。
音声認識 Transformers 韓国語
W
seastar105
285
3
Whisper Medium Id
Apache-2.0
openai/whisper-mediumをベースに、インドネシア語データセットで微調整した音声認識モデルで、インドネシア語の認識精度が大幅に向上しました。
音声認識 Transformers その他
W
cahya
1,961
21
Whisper Medium Jp
Apache-2.0
openai/whisper-mediumをcommon_voice_11_0データセットでファインチューニングした日本語音声認識モデル
音声認識 Transformers 日本語
W
vumichien
4,542
25
Whisper Large Khmer Asr
Apache-2.0
OpenAI Whisper Largeモデルをファインチューニングしたクメール語自動音声認識モデル、SLR42データセットでトレーニング済み
音声認識 Transformers その他
W
ksoky
37
2
Wav2vec2 Large Ru Golos With Lm
Apache-2.0
これはfacebook/wav2vec2-large-xlsr-53をベースに微調整されたロシア語音声認識モデルで、Sberdevices Golosデータセットを使用して訓練され、識別精度を向上させるために2-gram言語モデルが統合されています。
音声認識 Transformers その他
W
bond005
434
15
Wav2vec2 2 Bart Large Tedlium
TEDLIUMコーパスで訓練されたシーケンス・ツー・シーケンスの自動音声認識モデルで、Wav2Vec2音声エンコーダとBartテキストデコーダを組み合わせたもの
音声認識 英語
W
sanchit-gandhi
111
1
Wav2vec2 Base Timit Demo Google Colab
Apache-2.0
facebook/wav2vec2-baseモデルをTIMITデータセットでファインチューニングした音声認識モデル
音声認識 Transformers
W
Nancyzzz
103
0
Ai Light Dance Singing2 Ft Wav2vec2 Large Xlsr 53 V1
Apache-2.0
このモデルは、GARY109/AI_LIGHT_DANCE - ONSET-SINGING2データセットでwav2vec2-large-xlsr-53をファインチューニングした自動音声認識モデルで、主に歌唱音声認識タスクに使用されます。
音声認識 Transformers
A
gary109
185
0
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase