# 大規模音声モデル

W2v Bert 2.0 Naijavoices Clearglobal Hausa 500hr V0
MIT
facebook/w2v-bert-2.0をファインチューニングしたハウサ語音声認識モデルで、500時間のハウサ語データで訓練され、単語誤り率7.47%
音声認識 Transformers
W
asr-africa
16
1
Whisper Large V2 Hungarian
Apache-2.0
OpenAI Whisper Large-V2モデルをハンガリー語Common Voiceデータセットでファインチューニングした音声認識モデル
音声認識 Transformers その他
W
DrishtiSharma
21
1
Whisper Large V2 Punjabi
Apache-2.0
OpenAI Whisper-large-v2をファインチューニングしたパンジャーブ語自動音声認識モデル、Common Voice 11.0データセットでトレーニング
音声認識 Transformers その他
W
DrishtiSharma
27
1
Xlsr Wav2vec2 2
Apache-2.0
facebook/wav2vec2-large-xlsr-53をファインチューニングした音声認識モデルで、多言語音声からテキストへの変換タスクをサポート
音声認識 Transformers
X
chrisvinsen
20
0
Wav2vec2 Large Xls R 300m Urdu Cv8 200epochs
Common Voiceデータセットでトレーニングされたウルドゥー語音声認識モデル、wav2vec 2.0アーキテクチャ採用
音声認識 Transformers
W
omar47
20
0
Base Spanish Asr
汎用音声データセットでトレーニングされたスペイン語音声認識モデル、wav2vec2アーキテクチャを採用
音声認識 Transformers
B
glob-asr
19
0
Wav2vec2 Xls R 2b 21 To En
Apache-2.0
FacebookのWav2Vec2 XLS - Rモデルで、多言語音声から英語への翻訳タスクに使用されます。
音声認識 Transformers 複数言語対応
W
facebook
38
5
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase