# XLSR-53ファインチューニング

Ai Light Dance Singing Ft Wav2vec2 Large Xlsr 53
Apache-2.0
このモデルは、AI_LIGHT_DANCE - ONSET-SINGINGデータセットでfacebook/wav2vec2-large-xlsr-53をファインチューニングした自動音声認識モデルで、主に歌唱音声認識タスクに使用されます。
音声認識 Transformers
A
gary109
23
1
Wav2vec2 Large Xlsr Deepfake Audio Classification
Apache-2.0
wav2vec2アーキテクチャに基づく音声分類モデルで、ディープフェイク音声検出タスク向けにファインチューニングされており、性別認識と偽造音声検出において優れた性能を発揮します。
音声分類 Transformers
W
Gustking
345
3
Wav2vec2 Large Xlsr 53 Amharic
MIT
このモデルはfacebook/wav2vec2-large-xlsr-53を基に、アムハラ語音声コーパスでファインチューニングした自動音声認識(ASR)モデルです。
音声認識 Transformers その他
W
agkphysics
2,539
4
Exp W2v2t It Xlsr 53 S387
Apache-2.0
facebook/wav2vec2-large-xlsr-53モデルをファインチューニングしたイタリア語自動音声認識モデルで、Common Voice 7.0イタリア語データセットでトレーニングされています。
音声認識 Transformers その他
E
jonatasgrosman
18
0
Exp W2v2t Ja Xlsr 53 S109
Apache-2.0
facebook/wav2vec2-large-xlsr-53モデルをファインチューニングした日本語自動音声認識モデル、Common Voice 7.0日本語データセットで学習
音声認識 Transformers 日本語
E
jonatasgrosman
20
0
Ai Light Dance Stepmania Ft Wav2vec2 Large Xlsr 53 V7
Apache-2.0
wav2vec2-large-xlsr-53ベースの自動音声認識モデルで、StepManiaゲームオーディオに最適化され、GARY109/AI_LIGHT_DANCEデータセットでファインチューニング済み
音声認識 Transformers
A
gary109
162
0
Ai Light Dance Singing2 Ft Wav2vec2 Large Xlsr 53 5gram V4 2
wav2vec2-large-xlsr-53モデルをファインチューニングした自動音声認識モデルで、GARY109/AI_LIGHT_DANCEデータセットでトレーニング済み
音声認識 Transformers
A
gary109
68
1
Ai Light Dance Singing2 Ft Wav2vec2 Large Xlsr 53 5gram V3
wav2vec2-large-xlsr-53モデルをファインチューニングした自動音声認識モデルで、歌唱音声認識に特化
音声認識 Transformers
A
gary109
97
0
Ai Light Dance Stepmania Ft Wav2vec2 Large Xlsr 53 V6
Apache-2.0
このモデルは、GARY109/AI_LIGHT_DANCE - ONSET-STEPMANIA2データセットでwav2vec2-large-xlsr-53をファインチューニングした自動音声認識モデルです。
音声認識 Transformers
A
gary109
160
0
Ai Light Dance Singing2 Ft Wav2vec2 Large Xlsr 53 5gram V4 1
このモデルはwav2vec2-large-xlsr-53アーキテクチャに基づく自動音声認識(ASR)モデルで、GARY109/AI_LIGHT_DANCE - ONSET-SINGING2データセットでファインチューニングされ、歌唱音声認識タスクに主に使用されます。
音声認識 Transformers
A
gary109
66
1
Ai Light Dance Stepmania Ft Wav2vec2 Large Xlsr 53 V3
Apache-2.0
wav2vec2-large-xlsr-53ベースの自動音声認識モデルで、GARY109/AI_LIGHT_DANCEデータセットでファインチューニング済み
音声認識 Transformers
A
gary109
191
0
Ai Light Dance Singing2 Ft Wav2vec2 Large Xlsr 53 V1
Apache-2.0
このモデルは、GARY109/AI_LIGHT_DANCE - ONSET-SINGING2データセットでwav2vec2-large-xlsr-53をファインチューニングした自動音声認識モデルで、主に歌唱音声認識タスクに使用されます。
音声認識 Transformers
A
gary109
185
0
Ai Light Dance Stepmania Ft Wav2vec2 Large Xlsr 53 V2
Apache-2.0
このモデルは、GARY109/AI_LIGHT_DANCEデータセットでwav2vec2-large-xlsr-53をファインチューニングした自動音声認識モデルです
音声認識 Transformers
A
gary109
166
0
Ai Light Dance Stepmania Ft Wav2vec2 Large Xlsr 53 V1
Apache-2.0
このモデルは、wav2vec2-large-xlsr-53をGARY109/AI_LIGHT_DANCE - ONSET-STEPMANIA2データセットでファインチューニングした自動音声認識モデルです。
音声認識 Transformers
A
gary109
48
0
Ai Light Dance Singing2 Ft Wav2vec2 Large Xlsr 53
Apache-2.0
このモデルは、facebook/wav2vec2-large-xlsr-53をAI Light Danceデータセットでファインチューニングした自動音声認識モデルです。
音声認識 Transformers
A
gary109
26
1
Ai Light Dance Chord Ft Wav2vec2 Large Xlsr 53
Apache-2.0
このモデルはfacebook/wav2vec2-large-xlsr-53をベースに、GARY109/AI_Light_Dance - ONSET-CHORD2データセットでファインチューニングした自動音声認識モデルです。
音声認識 Transformers
A
gary109
46
0
Ai Light Dance Stepmania Ft Wav2vec2 Large Xlsr 53
Apache-2.0
このモデルはfacebook/wav2vec2-large-xlsr-53をGARY109/AI_LIGHT_DANCE - ONSET-STEPMANIA2データセットでファインチューニングした自動音声認識モデルです
音声認識 Transformers
A
gary109
40
0
Ai Light Dance Singing Ft Wav2vec2 Large Xlsr 53 5gram V1
このモデルはwav2vec2-large-xlsr-53を基にした自動音声認識モデルで、GARY109/AI_LIGHT_DANCE - ONSET-SINGINGデータセットでファインチューニングされ、主に歌唱音声認識に使用されます。
音声認識 Transformers
A
gary109
18
1
Wav2vec2 Large Multilang Cv Ru
Apache-2.0
このモデルはfacebook/wav2vec2-large-xlsr-53をcommon_voiceデータセットでファインチューニングしたバージョンで、主にロシア語音声認識タスクに使用されます。
音声認識 Transformers
W
cutten
16
0
Wav2vec2 Large Xlsr 53 Tr Fine Tuning Deprecated
Apache-2.0
このモデルはfacebook/wav2vec2-large-xlsr-53をcommon_voiceトルコ語データセットでファインチューニングした音声認識モデルです
音声認識 Transformers
W
bekirbakar
17
0
Wav2vec2 Large Xlsr 53 842h Luxembourgish 14h
MIT
842時間の未ラベルデータと14時間のラベル付きルクセンブルク語音声データでファインチューニングされたwav2vec2.0大規模モデル。ルクセンブルク語音声認識をサポート
音声認識 Transformers その他
W
Lemswasabi
204
0
Wav2vec2 Common Voice Tr Demo Dist
Apache-2.0
このモデルは、facebook/wav2vec2-large-xlsr-53をCOMMON_VOICE - TRトルコ語データセットでファインチューニングした自動音声認識(ASR)モデルで、評価セットで0.3242の単語誤り率を達成しました。
音声認識 Transformers その他
W
cromz22
26
0
FYP ARABIZI
Apache-2.0
このモデルはfacebook/wav2vec2-large-xlsr-53を未知のデータセットでファインチューニングした音声認識モデルで、アラビア語方言(Arabizi)の認識をサポートします。
音声認識 Transformers
F
ali-issa
33
1
Bach Arb
jonatasgrosman/wav2vec2-large-xlsr-53-germanを基にファインチューニングしたドイツ語音声認識モデル
音声認識 Transformers
B
bkh6722
30
0
Wav2vec2 Common Voice Lithuanian
Apache-2.0
このモデルはfacebook/wav2vec2-large-xlsr-53をCOMMON_VOICE - LTデータセットでファインチューニングしたバージョンで、リトアニア語音声認識に使用されます。
音声認識 Transformers その他
W
birgermoell
17
0
Ft Pt Br Local
Apache-2.0
jonatasgrosman/wav2vec2-large-xlsr-53-portugueseを基にファインチューニングしたポルトガル語自動音声認識モデル
音声認識 Transformers
F
tonyalves
31
1
Wav2vec2 Large Xlsr 53 Finnish
Apache-2.0
XLSR-53大規模モデルをファインチューニングしたフィンランド語音声認識モデル、16kHz音声入力に対応
音声認識 その他
W
jonatasgrosman
73.11k
1
Fb Vindata Vi Large
Apache-2.0
このモデルは、facebook/wav2vec2-large-xlsr-53をPHONGDTD/VINDATAVLSP - NAデータセットでファインチューニングしたベトナム語自動音声認識モデルです
音声認識 Transformers
F
phongdtd
29
0
Wav2vec2 Large Xlsr 53 Portuguese
Apache-2.0
これはポルトガル語音声認識タスク向けにファインチューニングされたXLSR-53大規模モデルで、Common Voice 6.1データセットでトレーニングされ、ポルトガル語音声からテキストへの変換をサポートします。
音声認識 その他
W
jonatasgrosman
4.9M
32
Wav2vec2 Large Xlsr Gu
Apache-2.0
facebook/wav2vec2-large-xlsr-53モデルを基にファインチューニングされたグジャラート語自動音声認識モデルで、OpenSLRデータセットで23.55%のWERを達成
音声認識 その他
W
gchhablani
3,582
0
Wav2vec2 Large Xlsr 53 Dutch
Apache-2.0
facebook/wav2vec2-large-xlsr-53をファインチューニングしたオランダ語音声認識モデルで、Common VoiceとCSS10データセットでトレーニングされ、16kHz音声入力に対応しています。
音声認識 その他
W
jonatasgrosman
3.0M
12
Wav2vec2 Common Voice Tr Demo
Apache-2.0
このモデルはfacebook/wav2vec2-large-xlsr-53をCOMMON_VOICE SV-SEデータセットでファインチューニングした自動音声認識(ASR)モデルで、スウェーデン語音声認識をサポートします。
音声認識 Transformers
W
birgermoell
17
0
Wav2vec2 Xlsr Khmer
Apache-2.0
facebook/wav2vec2-large-xlsr-53モデルをファインチューニングしたクメール語音声認識モデルで、OpenSLRクメール語データセットでWER24.96%を達成。
音声認識 その他
W
gagan3012
172
1
Wav2vec2 Large Xlsr 53 W2V2 TATAR SMALL
Apache-2.0
このモデルはfacebook/wav2vec2-large-xlsr-53をCommon Voice 8データセットでファインチューニングしたタタール語(Tatar)自動音声認識モデルで、テストセットのWERは53.16%です。
音声認識 Transformers その他
W
emre
30
1
Wav2vec2 Common Voice Ab Demo
Apache-2.0
facebook/wav2vec2-large-xlsr-53モデルをCOMMON_VOICE - ABデータセットでファインチューニングした音声認識モデル
音声認識 Transformers その他
W
patrickvonplaten
18
0
Wav2vec2 Common Voice Tr Demo
Apache-2.0
これはfacebook/wav2vec2-large-xlsr-53モデルをCOMMON_VOICE - TRトルコ語データセットでファインチューニングした自動音声認識(ASR)モデルです。
音声認識 Transformers その他
W
shiyue
25
0
Wav2vec2 Large Xlsr 53 Vietnamese
Apache-2.0
facebook/wav2vec2-large-xlsr-53モデルをベトナム語向けにファインチューニングした自動音声認識モデルで、16kHzサンプリングレートの音声入力をサポートします。
音声認識 Transformers その他
W
not-tanh
22
4
Wav2vec2 Luganda
Apache-2.0
Facebookのwav2vec2-large-xlsr-53モデルをファインチューニングしたルガンダ語自動音声認識システムで、Common Voiceルガンダ語データセットで7.53%のWERを達成。
音声認識 Transformers その他
W
indonesian-nlp
52
2
Wav2vec2 Large Xlsr 53 Japanese
Apache-2.0
facebook/wav2vec2-large-xlsr-53モデルをベースにファインチューニングした日本語音声認識モデルで、16kHzサンプリングレートの音声入力をサポート
音声認識 日本語
W
jonatasgrosman
2.9M
33
Wav2vec2 Large Xlsr 53 Chinese Zh Cn
Apache-2.0
facebook/wav2vec2-large-xlsr-53モデルをファインチューニングした中国語音声認識モデルで、16kHzサンプリングレートの音声入力をサポートしています。
音声認識 中国語
W
jonatasgrosman
3.8M
110
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase