# 16kHzサンプリングレート対応

Exp W2v2t Sv Se R Wav2vec2 S418
Apache-2.0
facebook/wav2vec2-large-robustモデルをファインチューニングしたスウェーデン語自動音声認識モデルで、16kHzサンプリングレートの音声入力をサポートします。
音声認識 Transformers
E
jonatasgrosman
32
0
Exp W2v2t It Vp Fr S821
Apache-2.0
facebook/wav2vec2-large-fr-voxpopuliモデルをファインチューニングしたイタリア語自動音声認識モデル、Common Voice 7.0イタリア語データセットでトレーニング
音声認識 Transformers その他
E
jonatasgrosman
27
0
Exp W2v2t It Wavlm S895
Apache-2.0
microsoft/wavlm-largeモデルを基にファインチューニングしたイタリア語自動音声認識モデルで、Common Voice 7.0イタリア語データセットでトレーニングされています。
音声認識 Transformers その他
E
jonatasgrosman
42
0
Wav2vec2 Large Xlsr 53 Ukrainian
Apache-2.0
facebook/wav2vec2-large-xlsr-53を基に、ウクライナ語でCommon Voiceデータセットを使用してファインチューニングした自動音声認識モデル
音声認識 その他
W
mrm8488
25
1
Wav2vec2 Large Xlsr Estonian
Apache-2.0
facebook/wav2vec2-large-xlsr-53をエストニア語Common Voiceデータセットでファインチューニングした自動音声認識モデル
音声認識 その他
W
manandey
21
0
Wav2vec2 Large Xlsr 53 Levantine Arabic
Apache-2.0
facebook/wav2vec2-large-xlsr-53モデルを基に、アラビア語音声コーパスデータセットでファインチューニングしたアラビア語音声認識モデル
音声認識 アラビア語
W
elgeish
46
4
Wav2vec2 Large Xls Ar
Apache-2.0
facebook/wav2vec2-large-xlsr-53モデルを基にファインチューニングしたアラビア語自動音声認識モデルで、Common Voiceアラビア語データセットでテストしたWERは52%です。
音声認識 Transformers アラビア語
W
mohamed1ai
30
1
Wav2vec2 Large Xlsr Tamil
Apache-2.0
facebook/wav2vec2-large-xlsr-53モデルを微調整したタミル語自動音声認識(ASR)モデル
音声認識 その他
W
Thanish
86
0
Wav2vec2 Large Xlsr Arabic
Apache-2.0
facebook/wav2vec2-large-xlsr-53をアラビア語Common Voiceデータセットでファインチューニングした音声認識モデル
音声認識 Transformers アラビア語
W
othrif
302
0
Wav2vec2 Large Robust Ft Libri 960h
Apache-2.0
このモデルはFacebook Wav2Vec2のファインチューニング版で、音声認識タスクに特化しており、複数の音声データで事前学習され、Librispeechでファインチューニングされており、高いロバスト性を持っています。
音声認識 Transformers 英語
W
facebook
161.65k
15
Wav2vec2 Large Xlsr 53 Euskera
Apache-2.0
facebook/wav2vec2-large-xlsr-53モデルをバスク語(Euskera)でCommon Voiceデータセットを使用してファインチューニングした音声認識モデル。
音声認識 その他
W
mrm8488
28
0
Wav2vec2 Base Voxpopuli Sv Swedish
FacebookのVoxPopuli-svベース版モデルをベースに、NSTとCommon Voiceのデータを使って微調整されたスウェーデン語音声認識モデルです。
音声認識 Transformers
W
KBLab
38
0
Vakyansh Wav2vec2 Hindi Him 4200
MIT
Wav2Vec2アーキテクチャに基づくヒンディー語自動音声認識モデルで、Harveen Chadhaによって開発され、4200時間のラベル付きヒンディー語データで微調整されました。
音声認識 Transformers その他
V
Harveenchadha
2,621
5
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase