# ロバスト音声処理

Wav2vec2 Large Robust 6 Ft Age Gender Finetuned Gtzan
wav2vec2アーキテクチャに基づく音声分類モデルで、privateSLIデータセットで微調整され、年齢と性別認識タスクに使用されます
音声分類 Transformers
W
languageresearch
15
0
Xls R 300 Sv Cv7
Apache-2.0
これはfacebook/wav2vec2-xls-r-300mをスウェーデン語Common Voice 7.0データセットでファインチューニングした自動音声認識モデルです
音声認識 Transformers その他
X
patrickvonplaten
19
0
Wav2vec2 Xls R 300m Indonesian
Apache-2.0
FacebookのXLS-R-300Mモデルをインドネシア語音声データでファインチューニングした自動音声認識モデル
音声認識 Transformers その他
W
Wikidepia
4,486
1
Wav2vec2 Large Xls R 1b Indonesian
Apache-2.0
facebook/wav2vec2-xls-r-1bをCommon Voiceインドネシア語データセットでファインチューニングした自動音声認識モデル
音声認識 Transformers その他
W
kingabzpro
14
1
Wav2vec2 Large Xls R 300m Hindi
Apache-2.0
これはfacebook/wav2vec2-xls-r-300mモデルをヒンディー語データセットでファインチューニングした音声認識モデルで、ヒンディー語音声からテキストへの変換タスクをサポートします。
音声認識 Transformers その他
W
ravirajoshi
26
0
Wav2vec2 Xls R 300m Turkish Tr Small
Apache-2.0
これはfacebook/wav2vec2 - xls - r - 300mモデルを汎用音声データセットで微調整したトルコ語音声認識モデルです。
音声認識 Transformers
W
emre
19
0
Wav2vec2 Base Turkish
Apache-2.0
このモデルはCommon Voiceトルコ語データセットでファインチューニングされたWav2Vec2音声認識モデルで、トルコ語自動音声認識タスクで優れた性能を発揮します。
音声認識 Transformers その他
W
cahya
49
4
Wav2vec2 Xls R 1b Korean
Apache-2.0
このモデルは、facebook/wav2vec2-xls-r-1bをKRESNIK/ZEROTH_KOREAN - CLEANデータセットでファインチューニングした韓国語自動音声認識モデルです。
音声認識 Transformers 韓国語
W
anantoj
20
2
Wav2vec2 Large Xlsr 53 Demo Colab
Apache-2.0
このモデルは、facebook/wav2vec2-large-xlsr-53をcommon_voiceデータセットで微調整した音声認識モデルで、主にロバスト音声イベント認識に使用されます。
音声認識 Transformers
W
emre
16
0
Wav2vec2 Xls R 300m Lm Hebrew
Apache-2.0
facebook/wav2vec2-xls-r-300mをベースに微調整されたヘブライ語音声認識モデルで、n-gram言語モデルが追加され強化されています。
音声認識 Transformers その他
W
imvladikon
21
1
Wav2vec2 Large Xls R 300m Latvian
Apache-2.0
これはfacebook/wav2vec2-xls-r-300mをラトビア語データセットでファインチューニングした自動音声認識モデルで、Common Voice 7テストセットで16.98%のWERを達成しました。
音声認識 Transformers その他
W
infinitejoy
222
1
Wav2vec2 Xls R Pt Cv7 From Bp400h
Apache-2.0
これはwav2vec2 XLS-Rアーキテクチャに基づくポルトガル語自動音声認識(ASR)モデルで、Common Voice 7データセットでファインチューニングされ、テストセットで12.13%の単語誤り率(WER)を達成しました。
音声認識 Transformers その他
W
lgris
94
0
Wav2vec2 Xls R 1b De Cv8
Apache-2.0
facebook/wav2vec2-xls-r-1bをCommon Voice 8ドイツ語データセットでファインチューニングした自動音声認識モデル
音声認識 Transformers ドイツ語
W
jsnfly
22
0
Wav2vec2 Indonesian Javanese Sundanese
Apache-2.0
これはインドネシア語、ジャワ語、スンダ語をサポートする多言語音声認識モデルで、facebook/wav2vec2-large-xlsr-53をファインチューニングして作成されました。
音声認識 Transformers その他
W
indonesian-nlp
298
6
Xls R 2B Te
Apache-2.0
これはfacebook/wav2vec2-xls-r-2bモデルをファインチューニングしたテルグ語自動音声認識(ASR)モデルで、OpenSLR SLR66データセットでトレーニングされました
音声認識 Transformers その他
X
chmanoj
20
0
Wav2vec2 Large Xls R 300m Sl With LM V1
Apache-2.0
これはfacebook/wav2vec2-xls-r-300mモデルをベースに、スロベニア語(Common Voice 8.0)データセットで微調整した自動音声認識(ASR)モデルで、言語モデル(LM)を組み合わせることで認識精度が向上しています。
音声認識 Transformers その他
W
DrishtiSharma
25
0
Wav2vec2 Large Xls R 300m Sat Final
Apache-2.0
これはfacebook/wav2vec2-xls-r-300mを基に、MOZILLA-FOUNDATION/COMMON_VOICE_8_0 - SATデータセットでファインチューニングされた自動音声認識モデルで、Santali (Ol Chiki)言語をサポートしています。
音声認識 Transformers その他
W
DrishtiSharma
28
0
Wav2vec2 Xls R 300m German De
Apache-2.0
このモデルは、facebook/wav2vec2 - xls - r - 300mをベースに、MOZILLA - FOUNDATION/COMMON_VOICE_7_0 - DEデータセットで微調整されたドイツ語自動音声認識モデルです。
音声認識 Transformers ドイツ語
W
AndrewMcDowell
72
3
Xls R 2b Nl V2 Lm 5gram Os2 Hunspell
XLS-RベースのCTCモデルで、Open Subtitlesの5-gram言語モデルを搭載し、主にオランダ語とフラマン語の自動音声認識に使用されます。
音声認識 Transformers その他
X
FremyCompany
18
4
Wav2vec2 Large Xlsr 53 Demo Colab
Apache-2.0
これはwav2vec2アーキテクチャに基づく自動音声認識モデルで、タミル語に特化して最適化されており、ネパール語音声認識タスクをサポートします。
音声認識 Transformers その他
W
Mahalakshmi
17
0
Wav2vec2 Large Xls R 300m Cv8 Nl
Apache-2.0
facebook/wav2vec2-xls-r-300mをCommon Voice 8オランダ語データセットでファインチューニングした自動音声認識モデル。6-gram KenLM言語モデルを含む
音声認識 Transformers その他
W
RuudVelo
22
0
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase