# Common Voice最適化

Distil Whisper Large V3 Ptbr
MIT
これはdistil-whisper-large-v3の微調整バージョンで、ブラジルポルトガル語の自動音声認識(ASR)に特化しており、Common Voice 16データセットと私有データセットを組み合わせて訓練されています。
音声認識 Safetensors
D
freds0
580
5
Whisper Medium Portuguese
Apache-2.0
openai/whisper-mediumをcommon_voice_11_0データセットで微調整したポルトガル語音声認識モデル、単語誤り率6.5987
音声認識 Transformers その他
W
pierreguillou
191
28
Wav2vec2 Large Xlsr 53 German With Lm
Apache-2.0
これはXLSR Wav2Vec2アーキテクチャに基づくドイツ語自動音声認識モデルで、言語モデルサポートを備えており、Common Voiceドイツ語データセットで優れた性能を発揮します。
音声認識 Transformers ドイツ語
W
aware-ai
19
7
Wav2vec2 Large Xlsr 53 Spanish With Lm
Apache-2.0
これはWav2Vec2-Large-XLSR-53をベースにしたスペイン語音声認識モデルで、言語モデルサポートを追加することで認識精度が大幅に向上しています。
音声認識 スペイン語
W
patrickvonplaten
2,198
8
Wav2vec2 Xls R 300m Hy
Apache-2.0
facebook/wav2vec2-xls-r-300mモデルをアルメニア語データセットでファインチューニングした自動音声認識(ASR)モデルで、アルメニア語音声からテキストへの変換タスクをサポートします。
音声認識 Transformers その他
W
arampacha
25
0
Wav2vec2 Base Turkish
Apache-2.0
このモデルはCommon Voiceトルコ語データセットでファインチューニングされたWav2Vec2音声認識モデルで、トルコ語自動音声認識タスクで優れた性能を発揮します。
音声認識 Transformers その他
W
cahya
49
4
Wav2vec2 Xls R 300m Cv8 Turkish
Apache-2.0
facebook/wav2vec2-xls-r-300mをファインチューニングしたトルコ語自動音声認識モデル、Common Voice 8.0 TRデータセットでトレーニング
音声認識 Transformers その他
W
mpoyraz
382
3
Wav2vec2 Large Fr Voxpopuli French
Apache-2.0
facebook/wav2vec2-large-fr-voxpopuliをファインチューニングしたフランス語音声認識モデル、Common Voice 6.1フランス語データセットでトレーニング、16kHz音声入力に対応
音声認識 フランス語
W
jonatasgrosman
51
3
Xls R Spanish Test
Apache-2.0
これはfacebook/wav2vec2-large-xlsr-53モデルをスペイン語Common Voice 7データセットで微調整した自動音声認識(ASR)モデルです。
音声認識 Transformers スペイン語
X
pablouribe
29
0
W2v Hf Commonvoice From Xlsr53 Pretrain 0329UTC1500
facebook/wav2vec2-large-xlsr-53をCommon Voice日本語データセットでファインチューニングした音声認識モデル
音声認識 Transformers
W
qqpann
15
0
Xls R 300m Es
Apache-2.0
スペイン語Common Voiceデータセットでファインチューニングされた音声認識モデル。facebook/wav2vec2-xls-r-300mアーキテクチャ採用。テストセットでWER14.6%を達成
音声認識 Transformers スペイン語
X
polodealvarado
23
4
Wav2vec2 Large Xlsr 53 Punjabi
Apache-2.0
これはHarveenchadha/vakyansh-wav2vec2-punjabi-pam-10をベースにCommon Voiceデータセットでファインチューニングしたパンジャーブ語自動音声認識モデルです
音声認識 Transformers その他
W
kingabzpro
189
2
Central Kurdish Xlsr
Apache-2.0
これはfacebook/wav2vec2 - xls - r - 300mモデルをベースに、クルド語中部方言で微調整された自動音声認識モデルで、Common Voice 8.0データセットで訓練されています。
音声認識 Transformers その他
C
Akashpb13
45
4
Hindi Base Wav2vec2
Apache-2.0
これはwav2vec2アーキテクチャに基づくヒンディー語の自動音声認識(ASR)モデルで、Common Voiceなどのデータセットで訓練されています。
音声認識 Transformers その他
H
Harveenchadha
49
2
Wav2vec2 Xls R Sl A2
Apache-2.0
これはfacebook/wav2vec2-xls-r-300mモデルを基に、スロベニア語(MOZILLA - FOUNDATION/COMMON_VOICE_8_0 - SL)データセットで微調整した自動音声認識モデルです。
音声認識 Transformers その他
W
DrishtiSharma
24
0
Wav2vec2 Large Xlsr 53 French Punctuation
Apache-2.0
wav2vec2-large-xlsr-53アーキテクチャに基づくフランス語自動音声認識モデルで、句読点予測をサポート
音声認識 フランス語
W
Ilyes
23
0
Xlsr Kurmanji Kurdish
Apache-2.0
このモデルは、facebook/wav2vec2 - xls - r - 300mをベースに、クルマンジ・クルド語データセットで微調整された自動音声認識モデルです。
音声認識 Transformers その他
X
Akashpb13
60
13
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase