# 汎用音声データセット

Wav2vec2 Base Cv 10000
Apache-2.0
wav2vec2-base-cvをベースに汎用音声データセットでファインチューニングした音声認識モデルで、評価セットで36.84%の単語誤り率を達成しました。
音声認識 Transformers
W
jiobiala24
28
0
Common6
COMMON_VOICE - FAデータセットを基に微調整されたペルシア語自動音声認識モデル
音声認識 Transformers その他
C
ghofrani
23
0
Wav2vec Tr Lite AG
Apache-2.0
これはXLSR Wav2Vec2アーキテクチャに基づくトルコ語自動音声認識モデルで、汎用音声トルコ語データセットでトレーニングされています
音声認識 その他
W
emre
26
0
Wav2vec2 Large Xlsr Kinyarwanda Apostrophied
Apache-2.0
facebook/wav2vec2-large-xlsr-53をベースにルワンダ語で微調整したモデルで、代名詞と母音で始まる単語の省略形のアポストロフィの予測をサポートします。
音声認識 その他
W
lucio
28
2
Wav2vec2 Large Xlsr Portuguese
Apache-2.0
Facebookのwav2vec2-large-xlsr-53アーキテクチャをベースに微調整されたポルトガル語自動音声認識モデルで、汎用音声データセットで学習され、単語誤り率は13.77%です。
音声認識 その他
W
joaoalvarenga
83
0
Wav2vec2 Base Checkpoint 14
Apache-2.0
wav2vec2アーキテクチャに基づく音声認識モデルで、汎用音声データセットでファインチューニングされています
音声認識 Transformers
W
jiobiala24
16
0
Wav2vec2 Large Xlsr Mongolian
Apache-2.0
facebook/wav2vec2-large-xlsr-53をモンゴル語汎用音声データセットでファインチューニングした自動音声認識モデル
音声認識 その他
W
manandey
4,719
0
Wav2vec2 Large Xlrs Estonian
Apache-2.0
これは、facebook/wav2vec2-large-xlsr-53モデルをベースに、エストニア語の汎用音声データセットで微調整された自動音声認識(ASR)モデルです。
音声認識 その他
W
birgermoell
18
0
Wav2vec2 Large Xlsr Luganda
Apache-2.0
facebook/wav2vec2-large-xlsr-53モデルをファインチューニングしたルガンダ語音声認識モデルで、汎用音声データセットで訓練され、単語誤り率29.52%
音声認識 その他
W
lucio
17
1
Wav2vec2 Large Xlsr Frisian
Apache-2.0
これはfacebook/wav2vec2-large-xlsr-53モデルをフリジア語で微調整した自動音声認識モデルで、汎用音声データセットを使用して訓練されています。
音声認識
W
iarfmoose
170
0
Xlsr Wav2vec English
Apache-2.0
facebook/wav2vec2-largeを汎用音声データセットで英語にファインチューニングした自動音声認識モデルで、16kHzサンプリングレートの音声入力をサポートします。
音声認識 Transformers 英語
X
harshit345
27
0
Wav2vec2 Large Xlsr Mongolian
Apache-2.0
facebook/wav2vec2-large-xlsr-53を基に汎用音声データセットでモンゴル語向けにファインチューニングした自動音声認識モデル
音声認識 Transformers その他
W
sammy786
22
0
Wav2vec2 Xls R 300m Zh CN
Apache-2.0
このモデルはfacebook/wav2vec2-xls-r-300mを汎用音声データセットZH-CNでファインチューニングした自動音声認識(ASR)モデルで、中国語普通話の認識をサポートします。
音声認識 Transformers その他
W
anantoj
37
0
Wav2vec2 Xls R 300m Hy AM CV8 V1
Apache-2.0
facebook/wav2vec2-xls-r-300mを基に汎用音声データセットでファインチューニングした音声認識モデル
音声認識 Transformers
W
emre
17
0
Wav2vec2 Xls R 300m Es
Apache-2.0
このモデルは、facebook/wav2vec2-xls-r-300mをCOMMON_VOICE - ESデータセットでファインチューニングしたスペイン語自動音声認識モデルです。
音声認識 Transformers スペイン語
W
samitizerxu
23
0
Wav2vec2 Large Xlsr 53 Chuvash
Apache-2.0
facebook/wav2vec2-large-xlsr-53モデルをベースに微調整されたチュヴァシ語自動音声認識モデルで、汎用音声データセットで訓練され、単語誤り率は40.01%です。
音声認識 その他
W
anton-l
30
0
Wav2vec2 Large Xlsr 53 Sah CV8
Apache-2.0
facebook/wav2vec2-large-xlsr-53をベースに、汎用音声ヤクート語データセットで微調整した音声認識モデル
音声認識 Transformers その他
W
emre
19
0
Wav2vec2 Xls R 300m Urdu
Facebookの3億パラメータの音声認識モデルで、ウルドゥー語に合わせて微調整され、汎用音声8.0ウルドゥー語データセットを基に訓練されています。
音声認識 Transformers
W
aasem
16
1
Base Spanish Asr
汎用音声データセットでトレーニングされたスペイン語音声認識モデル、wav2vec2アーキテクチャを採用
音声認識 Transformers
B
glob-asr
19
0
Wav2vec2 Large Xls R 300m Spanish Small
wav2vec2-large-xls-r-300mアーキテクチャに基づくスペイン語音声認識モデルで、汎用音声データセットで微調整され、単語誤り率(WER)は0.1791です。
音声認識 Transformers
W
tomascufaro
13
0
Wav2vec2 Xlsr Multilingual 56
Apache-2.0
これは56言語をサポートする多言語自動音声認識(ASR)モデルで、facebook/wav2vec2-large-xlsr-53を汎用音声データセットで微調整して作成されました。
音声認識 Transformers 複数言語対応
W
voidful
21.69k
30
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase