# Wav2Vec2アーキテクチャ

Indicwav2vec Hindi
Apache-2.0
Wav2Vec2アーキテクチャに基づくヒンディー語自動音声認識モデル、AI4Bharatによって開発
音声認識 Transformers その他
I
ai4bharat
34.90k
17
Indicwav2vec Odia
Apache-2.0
Wav2Vec2アーキテクチャに基づくヒンディー語自動音声認識(ASR)モデル、AI4Bharatによって開発
音声認識 Transformers その他
I
ai4bharat
401
2
Audio Classification Model
Apache-2.0
facebook/wav2vec2-base-960hを微調整した音声分類モデルで、具体的な用途とトレーニングデータは明記されていません。
音声分類 Transformers
A
SinghManish
19
1
Mms Lid 1024
このモデルはFacebookの大規模多言語音声プロジェクトの一部で、Wav2Vec2アーキテクチャに基づいており、1024言語の音声入力を識別できます。
音声分類 Transformers 複数言語対応
M
facebook
1,869
9
Mms Lid 512
これは512言語の音声言語識別(LID)向けにファインチューニングされたモデルで、Wav2Vec2アーキテクチャに基づき、入力音声の言語カテゴリを識別できます。
音声認識 Transformers 複数言語対応
M
facebook
32
2
Mms Lid 256
これはWav2Vec2アーキテクチャに基づく音声言語識別モデルで、256言語を識別可能であり、Facebookの大規模多言語音声(MMS)プロジェクトの一部です。
音声分類 Transformers 複数言語対応
M
facebook
48.38k
10
Mms Lid 126
Facebookの大規模多言語音声プロジェクトを基にファインチューニングした言語識別モデルで、126言語の音声分類をサポート
音声分類 Transformers 複数言語対応
M
facebook
2.1M
26
Accent Determinator
Wav2Vec2アーキテクチャに基づく音声分類モデルで、プエルトリコ、コロンビア、ベネズエラ、ペルー、チリのスペイン語アクセントを識別
音声分類 Transformers
A
hhsavich
29
2
Exp W2v2t It Vp Fr S821
Apache-2.0
facebook/wav2vec2-large-fr-voxpopuliモデルをファインチューニングしたイタリア語自動音声認識モデル、Common Voice 7.0イタリア語データセットでトレーニング
音声認識 Transformers その他
E
jonatasgrosman
27
0
Exp W2v2t It Vp 100k S449
Apache-2.0
facebook/wav2vec2-large-100k-voxpopuliモデルを基にファインチューニングしたイタリア語自動音声認識モデルで、Common Voice 7.0イタリア語データセットでトレーニングされています。
音声認識 Transformers その他
E
jonatasgrosman
17
0
Wav2vec2 Xlsr Greek Speech Emotion Recognition
Apache-2.0
Wav2Vec 2.0アーキテクチャに基づくギリシャ語音声感情認識モデルで、怒り、嫌悪、恐怖、幸福、悲しみの5つの感情を識別できます。
音声分類 その他
W
m3hrdadfi
213
9
Wav2vec2 Ksponspeech
Apache-2.0
Ksponspeechデータセットでファインチューニングされた韓国語音声認識モデルで、Wav2vec2-large-xlsr-53を基に最適化
音声認識 Transformers
W
Taeham
111
4
84rry Xls R 300M AR
Apache-2.0
このモデルは、facebook/wav2vec2-xls-r-300mをcommon_voiceデータセットでファインチューニングしたアラビア語音声認識モデルで、評価セットで0.5078の単語誤り率を達成しました。
音声認識 Transformers
8
84rry
27
0
Xlrs Best Lm
Apache-2.0
これはXLSR Wav2Vec2アーキテクチャに基づくインドネシア語自動音声認識モデルで、公共音声インドネシア語データセットでファインチューニングされています。
音声認識 Transformers その他
X
ridhoalattqas
19
1
Chinese Hubert Base
MIT
1万時間のWenetSpeech Lサブセットで事前学習された中国語音声モデル、音声関連タスクに適応
音声認識 Transformers
C
TencentGameMate
1,312
39
Wav2vec2 17
Apache-2.0
facebook/wav2vec2-baseをファインチューニングした音声認識モデルで、自動音声テキスト変換タスクをサポートします。
音声認識 Transformers
W
chrisvinsen
17
0
Wav2vec2 10
Apache-2.0
facebook/wav2vec2-baseをファインチューニングした音声認識モデルで、評価セットでの単語誤り率(WER)は1.0
音声認識 Transformers
W
chrisvinsen
20
0
Wav2vec2 Xlsr 53 Russian Emotion Recognition
MIT
これはXLS-R Wav2Vec2アーキテクチャに基づくロシア語音声感情認識モデルで、7つの基本感情を72%の精度で識別可能です。
音声分類 Transformers その他
W
Aniemore
1,106
13
Wav2vec2 3
Apache-2.0
facebook/wav2vec2-baseを微調整した音声認識モデルで、単語誤り率(WER)は1.0
音声認識 Transformers
W
chrisvinsen
16
0
D L Dl
このモデルはfacebook/wav2vec2-base-960hをファインチューニングした音声認識モデルで、評価セットでの単語誤り率(WER)は1.0です。
音声認識 Transformers
D
bkh6722
25
0
English Filipino Wav2vec2 L Xls R Test 07
Apache-2.0
このモデルはjonatasgrosman/wav2vec2-large-xlsr-53-englishをベースにフィリピン語音声データセットでファインチューニングしたバージョンで、英語からフィリピン語への音声認識タスクに主に使用されます。
音声認識 Transformers
E
Khalsuu
24
0
Wav2vec2 Base Timit Demo Colab3
Apache-2.0
facebook/wav2vec2-baseモデルをTIMITデータセットでファインチューニングした音声認識モデル
音声認識 Transformers
W
sherry7144
24
0
Wav2vec2 Base Timit Demo Colab1
Apache-2.0
このモデルはfacebook/wav2vec2-baseをファインチューニングした音声認識モデルで、TIMITデータセットでトレーニングと評価が行われました。
音声認識 Transformers
W
cuzeverynameistaken
16
0
Wav2vec2 Base Timit Demo Colab60
Apache-2.0
このモデルはfacebook/wav2vec2-baseをファインチューニングした音声認識モデルで、TIMITデータセットで60エポック訓練され、単語誤り率(WER)が1.0を達成しました。
音声認識 Transformers
W
hassnain
16
0
Wav2vec2 Base Timit Demo Colab7
Apache-2.0
このモデルはfacebook/wav2vec2-baseをファインチューニングした音声認識モデルで、TIMITデータセットで訓練され、単語誤り率(WER)は0.5426です。
音声認識 Transformers
W
sameearif88
16
0
Wav2vec2 Base Timit Demo Colab7
Apache-2.0
facebook/wav2vec2-baseモデルをTIMITデータセットでファインチューニングした音声認識モデルで、主に英語音声からテキストへの変換タスクに使用されます。
音声認識 Transformers
W
hassnain
16
0
Wav2vec2 Base Timit Demo Colab3
Apache-2.0
このモデルはfacebook/wav2vec2-baseをファインチューニングした音声認識モデルで、TIMITデータセットで訓練され、評価単語誤り率は0.5608です。
音声認識 Transformers
W
sameearif88
16
0
Wav2vec2 Base Timit Demo Colab2
Apache-2.0
このモデルはfacebook/wav2vec2-baseを微調整した音声認識モデルで、評価セットで0.5664の単語誤り率(WER)を達成しました。
音声認識 Transformers
W
sameearif88
16
0
Wav2vec2 Base Timit Demo Colab6
Apache-2.0
このモデルはfacebook/wav2vec2-baseをファインチューニングした音声認識モデルで、TIMITデータセットで訓練され、単語誤り率(WER)は0.5282です。
音声認識 Transformers
W
hassnain
19
0
Wav2vec2 Base Timit Demo Colab1
Apache-2.0
このモデルはfacebook/wav2vec2-baseをファインチューニングした音声認識モデルで、TIMITデータセットで訓練され、単語誤り率(WER)は1.0です。
音声認識 Transformers
W
tahazakir
24
0
Xlsr 53 Bemba 5hrs
Apache-2.0
facebook/wav2vec2-large-xlsr-53をファインチューニングした音声認識モデルで、Bemba語をサポート
音声認識 Transformers
X
csikasote
25
0
Ctrlv Wav2vec2 Tokenizer
Apache-2.0
facebook/wav2vec2-baseをファインチューニングした音声認識モデルで、評価セットで31.38%の単語誤り率を達成
音声認識 Transformers
C
proseph
25
0
Wav2vec2 Base Timit Moaiz Explast
Apache-2.0
このモデルはfacebook/wav2vec2-baseをTIMITデータセットでファインチューニングした音声認識モデルで、主に英語音声からテキストへの変換タスクに使用されます。
音声認識 Transformers
W
moaiz237
19
0
Wav2vec2 Commonvoice Tamil
MIT
Harveenchadha/vakyansh-wav2vec2-tamil-tam-250をベースにcommon_voiceデータセットで微調整したタミル語音声認識モデル
音声認識 Transformers
W
nikhil6041
40
0
Wav2vec2 Base Toy Train Data Slow 10pct
Apache-2.0
facebook/wav2vec2-baseモデルを未知のデータセットでファインチューニングした音声認識モデル、単語誤り率(WER)は0.7175
音声認識 Transformers
W
scasutt
22
0
Wav2vec2 Base Toy Train Data Masked Audio 10ms
Apache-2.0
facebook/wav2vec2-baseを微調整した音声認識モデルで、10ms音声マスキングタスクでトレーニング
音声認識 Transformers
W
scasutt
22
0
Wav2vec2 Marathi Stt
これはWav2Vec2アーキテクチャに基づくマラーティー語(Marathi)音声認識モデルで、音声を直接テキストに変換できます。
音声認識 Transformers
W
addy88
30
0
Wav2vec2 Sanskrit Stt
Wav2Vec2アーキテクチャに基づくサンスクリット音声認識モデルで、サンスクリット音声をテキストに変換できます
音声認識 Transformers
W
addy88
15
0
Wav2vec2 Urdu
Apache-2.0
wav2vec2アーキテクチャに基づくウルドゥー語自動音声認識モデル、Common Voiceデータセットでファインチューニング
音声認識 Transformers その他
W
kingabzpro
101
3
Wav2vec2 Large Xls R 300m Breton Cv8
Apache-2.0
これはfacebook/wav2vec2-xls-r-300mをブルトン語データセットで微調整した自動音声認識モデルです
音声認識 Transformers その他
W
infinitejoy
17
0
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase