# wav2vec2アーキテクチャ

Japanese Wav2vec2 Base
Apache-2.0
rinna株式会社によってトレーニングされた日本語wav2vec 2.0ベースモデル、ReazonSpeechデータセットに基づいてトレーニング
音声認識 Transformers 日本語
J
rinna
5,378
6
Wav2vec2 Base Finetuned Amd
Apache-2.0
このモデルはfacebook/wav2vec2-baseを未知のデータセットでファインチューニングしたバージョンで、主に音声認識タスクに使用され、評価セットで84.55%の精度を達成しています。
音声認識 Transformers
W
justin1983
14
0
Wav2vec2 Large Xlsr 53 Gender Recognition Librispeech
Apache-2.0
Librispeech-clean-100データセットで微調整された性別認識モデルで、テストセットでF1スコア0.9993を達成
音声分類 Transformers
W
alefiury
182.33k
42
Wav2vec2 Spoof Dection1
Apache-2.0
facebook/wav2vec2-baseをasvspoof2019データセットでファインチューニングした音声偽造検出モデル
音声分類 Transformers
W
WWWxp
26
0
Wav2vec2 Base Vi Vlsp2020
wav2vec2アーキテクチャに基づくベトナム語自動音声認識モデル。13,000時間の未ラベルYouTube音声で事前学習され、250時間のラベル付きデータで微調整されています。
音声認識 Transformers その他
W
nguyenvulebinh
262
3
Wav2vec2 Conformer Rel Pos Large 960h Ft Intent Classification Ori
Apache-2.0
このモデルはfacebook/wav2vec2-conformer-rel-pos-large-960h-ftをファインチューニングした音声意図分類モデルで、評価セットで58.33%の精度を達成しました。
音声分類 Transformers
W
MuhammadIqbalBazmi
15
0
Wav2vec2 Base Finetuned Ks
Apache-2.0
facebook/wav2vec2-baseモデルをベースにファインチューニングした音声認識モデルで、評価セットで87.27%の精度を達成しました。
音声認識 Transformers
W
FerhatDk
38
0
Exp W2v2t Sv Se R Wav2vec2 S418
Apache-2.0
facebook/wav2vec2-large-robustモデルをファインチューニングしたスウェーデン語自動音声認識モデルで、16kHzサンプリングレートの音声入力をサポートします。
音声認識 Transformers
E
jonatasgrosman
32
0
Exp W2v2t Fr Vp Fr S438
Apache-2.0
facebook/wav2vec2-large-fr-voxpopuliモデルを基にファインチューニングしたフランス語自動音声認識モデルで、Common Voice 7.0フランス語データセットでトレーニングされています。
音声認識 Transformers フランス語
E
jonatasgrosman
20
0
Exp W2v2t Th Wav2vec2 S664
Apache-2.0
facebook/wav2vec2-large-lv60モデルをファインチューニングしたタイ語音声認識モデル、Common Voice 7.0データセットでトレーニング
音声認識 Transformers その他
E
jonatasgrosman
14
0
Wav2vec Cv
Apache-2.0
facebook/wav2vec2-base-960hをファインチューニングした音声認識モデル
音声認識 Transformers
W
eugenetanjc
69
0
Wav2vec Mle
Apache-2.0
facebook/wav2vec2-base-960hをベースにファインチューニングした音声認識モデルで、評価セットでの単語誤り率は1.0
音声認識 Transformers
W
eugenetanjc
68
0
Wav2vec2 1
Apache-2.0
このモデルはfacebook/wav2vec2-baseをファインチューニングした音声認識モデルで、評価セットで0.4949の単語誤り率を達成しました。
音声認識 Transformers
W
chrisvinsen
16
0
Wav2vec2 Base Timit Demo Colab240
Apache-2.0
facebook/wav2vec2-baseモデルをファインチューニングした音声認識モデルで、TIMITデータセットでトレーニングされています
音声認識 Transformers
W
hassnain
16
0
My Final Wav2vec2 Urdu Asr Project
これはwav2vec2アーキテクチャに基づくウルドゥー語自動音声認識(ASR)モデルで、ゼロからトレーニングされています。
音声認識 Transformers
M
Raffay
24
0
Wav2vec2 Base Timit Demo Colab3
Apache-2.0
このモデルはfacebook/wav2vec2-baseをベースにファインチューニングされた音声認識モデルで、TIMITデータセットで0.6704の単語誤り率を達成しました。
音声認識 Transformers
W
hassnain
21
0
Wav2vec2 Base Timit Demo Colab
Apache-2.0
wav2vec2-baseモデルをTIMITデータセットでファインチューニングした音声認識モデル
音声認識 Transformers
W
ali221000262
23
0
Common Voice Lithuanian Fairseq
Apache-2.0
Common Voiceデータセットでトレーニングされたリトアニア語自動音声認識モデルで、wav2vec2アーキテクチャとfairseqフレームワークを使用しています。
音声認識 Transformers その他
C
birgermoell
30
0
Wav2vec2 Base Toy Train Data Random High Pass
Apache-2.0
facebook/wav2vec2-baseを空データセットでファインチューニングした音声認識モデルで、ランダムハイパスフィルタ技術を使用してトレーニングデータを処理しました
音声認識 Transformers
W
scasutt
29
0
Wav2vec2 Pretrained Clsril 23 10k
自己教師付き学習に基づく音声事前学習モデルで、23種類のインド語の生の音声から多言語音声表現を学習できます。
音声認識 Transformers
W
Harveenchadha
32
5
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase