# 多シーン音声文字起こし

Wav2vec2 Base 10k Voxpopuli Ft Ro
FacebookのWav2Vec2アーキテクチャに基づく音声認識モデルで、ルーマニア語に対して微調整され、自動音声認識タスクに適しています。
音声認識 Transformers その他
W
facebook
36
0
Wav2vec2 Base Turkish Cv8
これはCommon Voice 8.0トルコ語データセットを基に微調整された自動音声認識(ASR)モデルで、トルコ語の音声をテキストに変換することができます。
音声認識 Transformers その他
W
cahya
16
1
Wav2vec2 Large Xls R 300m Basque
Apache-2.0
facebook/wav2vec2-xls-r-300mをベースに、バスク語のCommon Voiceデータセットで微調整した自動音声認識モデル
音声認識 Transformers その他
W
deepdml
31
0
Wav2vec2 Large Xls R 300m Bulgarian
Apache-2.0
facebook/wav2vec2 - xls - r - 300mをMOZILLA - FOUNDATION/COMMON_VOICE_7_0 - BGデータセットでファインチューニングしたブルガリア語音声認識モデル
音声認識 Transformers その他
W
infinitejoy
10.59k
2
Wav2vec2 Large Xlsr 53 Dutch
Apache-2.0
Facebookが開発したWav2Vec 2.0アーキテクチャに基づくオランダ語自動音声認識(ASR)モデルで、XLSR - 53多言語事前学習モデルを微調整しています。
音声認識 その他
W
facebook
203
2
Wav2vec2 Large Xls R 300m Pa IN Dx1
Apache-2.0
これはfacebook/wav2vec2-xls-r-300mをベースに、パンジャブ語(インド)データセットで微調整された自動音声認識モデルです。
音声認識 Transformers
W
DrishtiSharma
28
0
Wav2vec2 Large Xls R 300m Hsb V1
Apache-2.0
これはfacebook/wav2vec2-xls-r-300mをベースに、上ソルブ語(HSB)データセットで微調整された自動音声認識モデルで、Common Voice 8テストセットで0.4393の単語誤り率(WER)を達成しました。
音声認識 Transformers その他
W
DrishtiSharma
20
0
Wav2vec2 Large Xls R 300m As V9
Apache-2.0
facebook/wav2vec2-xls-r-300mをベースに、アッサム語(Common Voice 8.0)データセットでファインチューニングした自動音声認識モデル
音声認識 Transformers その他
W
DrishtiSharma
20
0
Wav2vec2 Large Xlsr 53 Frisian
Apache-2.0
これはwav2vec2-large-xlsr-53モデルを微調整したフリジア語の自動音声認識(ASR)モデルで、RuudVeloによって開発されました。
音声認識
W
RuudVelo
31
0
Xls Npsc Oh
このモデルは、KBLab/wav2vec2 - large - voxrexをベースに、NBAILAB/NPSC - 48K_MP3データセットで微調整された自動音声認識モデルです。
音声認識 Transformers
X
NbAiLab
30
0
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase