# 音声認識の微調整

Audio Classification Model
Apache-2.0
facebook/wav2vec2-base-960hを微調整した音声分類モデルで、具体的な用途とトレーニングデータは明記されていません。
音声分類 Transformers
A
SinghManish
19
1
Neunit Ks
Apache-2.0
facebook/wav2vec2-baseを微調整した音声処理モデル、精度は28.57%
音声認識 Transformers
N
SHENMU007
23
0
Wav2vec2 Nsc Final 2 Google Colab
Apache-2.0
facebook/wav2vec2-baseを微調整した音声処理モデル、具体的な用途は明記されていません
音声認識 Transformers
W
YuanWellspring
14
0
Wav2vec2 Base Librispeech Demo Colab
Apache-2.0
このモデルはfacebook/wav2vec2-baseをLibriSpeechデータセットで微調整した音声認識モデルで、英語音声からテキストへの変換タスクに適しています。
音声認識 Transformers
W
khanhnguyen
24
0
Part1
Apache-2.0
このモデルはfacebook/wav2vec2-baseを微調整した音声処理モデルで、具体的な用途は明記されていません
音声認識 Transformers
P
zasheza
28
0
Wav2vec2 Base Toy Train Data Random Low Pass
Apache-2.0
このモデルはfacebook/wav2vec2-baseを未知のデータセットで微調整した音声認識モデルで、自動音声認識(ASR)タスクに主に使用されます。
音声認識 Transformers
W
scasutt
29
0
Wav2vec2 Large Xlsr 53 Toy Train Data Masked Audio 10ms
Apache-2.0
facebook/wav2vec2-large-xlsr-53を基に微調整した音声認識モデルで、10ms音声マスキング訓練データで最適化されています
音声認識 Transformers
W
scasutt
22
0
Wav2vec2 Base Toy Train Data Masked Audio 10ms
Apache-2.0
facebook/wav2vec2-baseを微調整した音声認識モデルで、10ms音声マスキングタスクでトレーニング
音声認識 Transformers
W
scasutt
22
0
Wav2vec2 Base Toy Train Data Augment 0.1
Apache-2.0
facebook/wav2vec2-baseを微調整した音声認識モデルで、玩具データセットで訓練され、0.1の比率でデータ拡張が適用されています
音声認識 Transformers
W
scasutt
22
0
Wav2vec2 Base Toy Train Data Augment 0.1.csv
Apache-2.0
このモデルはfacebook/wav2vec2-baseをベースに微調整された音声認識モデルで、データ拡張技術(拡張率0.1)を使用しています。
音声認識 Transformers
W
scasutt
21
0
Wav2vec2 Model1 Torgo
Apache-2.0
facebook/wav2vec2-baseをベースに微調整した音声認識モデル
音声認識 Transformers
W
modhp
20
0
Wav2vec2 Large Xlsr 53 Toy Train Data Augment 0.1.csv
Apache-2.0
このモデルはfacebook/wav2vec2-baseを微調整した音声認識モデルで、データ拡張技術を使用して訓練されています
音声認識 Transformers
W
scasutt
22
0
Sew D Small 100k Ft Timit
Apache-2.0
asapp/sew-d-small-100kを基にTIMIT_ASRデータセットで微調整された自動音声認識モデル
音声認識 Transformers
S
patrickvonplaten
18
0
Sew D Small 100k Timit
Apache-2.0
このモデルはasapp/sew-d-small-100kをベースにTIMIT_ASR - NAデータセットで微調整された自動音声認識モデルで、評価セットで0.8061の単語誤り率を達成しました。
音声認識 Transformers
S
patrickvonplaten
16
0
Alphadelay
Apache-2.0
facebook/wav2vec2-baseを微調整した音声認識モデル、単語誤り率(WER)は1.0
音声認識 Transformers
A
renBaikau
17
0
Sat Base
microsoft/unispeech-sat-baseをTIMIT_ASRデータセットで微調整した自動音声認識モデル
音声認識 Transformers
S
patrickvonplaten
22
0
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase