# 高精度WER

Wav2vec2 Large Xlrs Korean V5
Apache-2.0
このモデルはfacebook/wav2vec2-xls-r-300mをzeroth_koreanデータセットでファインチューニングした韓国語自動音声認識モデルで、単語誤り率は0.2433です。
音声認識 Transformers
W
student-47
285
1
Wav2vec2 Large Xlsr 53 Icelandic Ep30 967h
アイスランド語の自動音声認識タスク用に微調整された音響モデルで、967時間のアイスランド語データを使って訓練されました。
音声認識 Transformers その他
W
language-and-voice-lab
2,153
2
Stt Ru Fastconformer Hybrid Large Pc
これはロシア語自動音声認識のためのFastConformerハイブリッドモデルで、TransducerとCTCデコーダーを組み合わせ、パラメータ規模は約1.15億です。
音声認識 その他
S
nvidia
6,513
10
Stt De Fastconformer Hybrid Large Pc
これはFastConformerアーキテクチャに基づくドイツ語自動音声認識モデルで、トランスフォーマーとCTCのハイブリッド訓練方式を採用し、パラメータ規模は約115Mです。
音声認識 ドイツ語
S
nvidia
1,017
4
Wav2vec2 Large Xlsr 53 Spanish Ep5 944h
スペイン語自動音声認識用の音響モデルで、facebook/wav2vec2-large-xlsr-53を5エポックにわたってファインチューニングし、約944時間のスペイン語データを使用しています。
音声認識 Transformers スペイン語
W
carlosdanielhernandezmena
111
3
Wav2vec2 Large Vi Vlsp2020
wav2vec2アーキテクチャに基づくベトナム語自動音声認識モデル。1.3万時間の未ラベルYouTube音声で事前学習し、250時間のラベル付きデータでファインチューニング
音声認識 Transformers その他
W
nguyenvulebinh
385
4
Stt Ru Conformer Ctc Large
これはロシア語の自動音声認識用の大規模なConformer-CTCモデルで、約1636時間のロシア語音声データでトレーニングされ、約1.2億のパラメータを持っています。
音声認識 その他
S
nvidia
452
5
Stt Es Conformer Ctc Large
これはNVIDIAがトレーニングし公開した、スペイン語自動音声認識(ASR)用の大型Conformer-CTCモデルです。
音声認識 スペイン語
S
nvidia
59
2
Stt Fr Conformer Transducer Large
これはフランス語自動音声認識のための大規模なConformer-トランスデューサーモデルで、約1.2億のパラメータを持ち、1500時間以上のフランス語音声データでトレーニングされています。
音声認識 フランス語
S
nvidia
31
10
Wav2vec2 Large 960h Lv60 Self 4 Gram Fine Tune Real 29 Jun
Apache-2.0
このモデルはfacebook/wav2vec2-large-960h-lv60-selfをuob_singlishデータセットでファインチューニングした音声認識モデルで、シンガポール英語の認識をサポートします。
音声認識 Transformers
W
RuiqianLi
105
0
Stt Fr Conformer Ctc Large
これはConformerアーキテクチャに基づくフランス語自動音声認識(ASR)の大規模モデルで、CTC損失関数を使用し、1500時間以上のフランス語音声データでトレーニングされています。
音声認識 フランス語
S
nvidia
361
6
Ai Light Dance Stepmania Ft Wav2vec2 Large Xlsr 53
Apache-2.0
このモデルはfacebook/wav2vec2-large-xlsr-53をGARY109/AI_LIGHT_DANCE - ONSET-STEPMANIA2データセットでファインチューニングした自動音声認識モデルです
音声認識 Transformers
A
gary109
40
0
Wav2vec2 Large Multilang Cv Ru
Apache-2.0
このモデルはfacebook/wav2vec2-large-xlsr-53をcommon_voiceデータセットでファインチューニングしたバージョンで、主にロシア語音声認識タスクに使用されます。
音声認識 Transformers
W
cutten
16
0
Assignment1 Maria
MIT
s2t-small-librispeech-asr は自動音声認識(ASR)のための音声からテキストへの変換(S2T)モデルで、シーケンス・ツー・シーケンスのトランスフォーマーアーキテクチャに基づいています。
音声認識 Transformers 英語
A
Classroom-workshop
23
0
Assignment1 Joane
MIT
自動音声認識(ASR)のための音声からテキストへの変換(S2T)モデル
音声認識 Transformers 英語
A
Classroom-workshop
22
0
Assignment1 Jack
MIT
自動音声認識(ASR)のための音声からテキストへの変換(S2T)モデルで、シーケンス・ツー・シーケンス変換アーキテクチャに基づいています
音声認識 Transformers 英語
A
Classroom-workshop
24
0
Assignment1 Jane
MIT
s2t-small-librispeech-asr は、自動音声認識(ASR)のための音声からテキストへの変換器(S2T)モデルで、シーケンス・ツー・シーケンス変換器アーキテクチャに基づいています。
音声認識 Transformers 英語
A
Classroom-workshop
29
0
Assignment1 Omar
Apache-2.0
Wav2Vec2は自己教師あり学習に基づく音声認識モデルで、LibriSpeechの960時間の音声データで事前学習と微調整が行われ、英語音声の書き起こしをサポートします。
音声認識 Transformers 英語
A
Classroom-workshop
28
0
Wav2vec2 Large Xls R 300m Singlish Colab
Apache-2.0
facebook/wav2vec2-xls-r-300mをシンガポール英語(li_singlish)データセットでファインチューニングした音声認識モデル
音声認識 Transformers
W
RuiqianLi
22
1
Ai Light Dance Singing Ft Wav2vec2 Large Lv60 V2
Apache-2.0
このモデルはwav2vec2-large-lv60をONSET-SINGINGデータセットでファインチューニングした歌声音声認識モデルです。
音声認識 Transformers
A
gary109
16
1
Dansk Wav2vec21
Apache-2.0
このモデルは、Siyam/SKYLyがcommon_voiceデータセットでファインチューニングしたデンマーク語音声認識モデルです
音声認識 Transformers
D
Siyam
32
0
English Filipino Wav2vec2 L Xls R Test 02
Apache-2.0
これはwav2vec2-large-xlsr-53-englishモデルをフィリピン語音声データセットでファインチューニングした音声認識モデルで、英語とフィリピン語の音声からテキストへの変換タスクをサポートします。
音声認識 Transformers
E
Khalsuu
21
0
Wav2vec2 Common Voice Lithuanian
Apache-2.0
このモデルはfacebook/wav2vec2-large-xlsr-53をCOMMON_VOICE - LTデータセットでファインチューニングしたバージョンで、リトアニア語音声認識に使用されます。
音声認識 Transformers その他
W
birgermoell
17
0
20220413 210552
Apache-2.0
このモデルは、facebook/wav2vec2-xls-r-300mをcommon_voiceデータセットでファインチューニングした音声認識モデルです
音声認識 Transformers
2
lilitket
18
0
Aradia Ctc Distilhubert Ft
Apache-2.0
アラビア語音声データセットでdistilhubertを微調整した自動音声認識(ASR)モデル
音声認識 Transformers
A
abdusah
16
0
Wav2vec2 Large Xls R 300m Irish Colab Test
Apache-2.0
これはfacebook/wav2vec2-xls-r-300mモデルをcommon_voiceアイルランド語データセットでファインチューニングした音声認識モデルで、主にアイルランド語の自動音声認識タスクに使用されます。
音声認識 Transformers
W
jfealko
24
0
Wav2vec2 Xls R 1b Npsc Bokmaal
Apache-2.0
facebook/wav2vec2-xls-r-1bモデルを基に、ノルウェー書面語(ブークモール)音声データセットでファインチューニングした自動音声認識モデル
音声認識 Transformers
W
NbAiLab
23
0
Wav2vec2 Large Xls R 300m Ur
Apache-2.0
wav2vec2-large-xls-r-300mアーキテクチャに基づくウルドゥー語音声認識モデル、common_voiceデータセットでファインチューニング済み
音声認識 Transformers
W
anuragshas
20
0
Wav2vec2 Xl 960h Dementiabank
Apache-2.0
このモデルはfacebook/wav2vec2-large-960hをDementiaBankデータセットでファインチューニングした音声認識モデルで、主に音声からテキストへの変換タスクに使用されます。
音声認識 Transformers
W
shields
20
0
Wav2vec2 Xls R 1b Portuguese
Apache-2.0
これはXLS-R 1Bアーキテクチャに基づくポルトガル語自動音声認識モデルで、複数のポルトガル語音声データセットでファインチューニングされています。
音声認識 Transformers その他
W
jonatasgrosman
648.50k
12
Wav2vec2 Xls R Hindi
Apache-2.0
これはfacebook/wav2vec2-xls-r-300mをヒンディー語Common Voice 7.0データセットでファインチューニングした自動音声認識(ASR)モデルです
音声認識 Transformers その他
W
shivam
19
1
Wav2vec2 Large Xls R 300m Galician
Apache-2.0
これはfacebook/wav2vec2-xls-r-300mをベースに、ガリシア語音声データセットで微調整された自動音声認識モデルです。
音声認識 Transformers その他
W
infinitejoy
31
0
Wav2vec2 Xls R 1b English
Apache-2.0
これはXLS - R 1Bアーキテクチャに基づく英語音声認識モデルで、複数の英語音声データセットで微調整されています。
音声認識 Transformers 英語
W
jonatasgrosman
1,896
9
Wav2vec2 Large Xls R 300m Odia Cv8
Apache-2.0
facebook/wav2vec2-xls-r-300mをオディア語(OR)Common Voiceデータセットでファインチューニングした自動音声認識モデル
音声認識 Transformers その他
W
infinitejoy
16
0
Wav2vec2 Xls R 1b Russian
Apache-2.0
XLS-R 1Bアーキテクチャを基に微調整されたロシア語音声認識モデル、Common Voice 8.0などのデータセットでトレーニング
音声認識 Transformers その他
W
jonatasgrosman
765
14
Wav2vec2 Xlsr Basaa
Apache-2.0
このモデルはfacebook/wav2vec2-xls-r-1bをCommon Voice 8バサ語データセットでファインチューニングした自動音声認識モデルです。
音声認識 Transformers その他
W
sammy786
20
0
Wav2vec2 Large Xlsr 53 Ir
Apache-2.0
wav2vec2-large-xlsr-53を微調整したアイルランド・ゲール語自動音声識別モデルで、Common Voice 7.0データセットで訓練されました。
音声認識 Transformers
W
jcmc
24
0
Wav2vec2 Xls R 1b Italian
Apache-2.0
これはXLS-R 1Bアーキテクチャに基づくイタリア語自動音声認識モデルで、複数のイタリア語データセットでファインチューニングされています
音声認識 Transformers その他
W
jonatasgrosman
2,703
1
Wav2vec2 Speechdat
Apache-2.0
このモデルは、facebook/wav2vec2-large-xlsr-53をベースに、COMMON_VOICE - SV-SEデータセットで微調整されたスウェーデン語自動音声認識モデルです。
音声認識 Transformers
W
birgermoell
29
0
Wav2vec2 Large Xls R 300m Irish
Apache-2.0
このモデルはfacebook/wav2vec2-xls-r-300mをアイルランド語データセットでファインチューニングした自動音声認識(ASR)モデルです
音声認識 Transformers
W
infinitejoy
16
0
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase