ai-light-dance_stepmania_ft_wav2vec2-large-xlsr-53-v7オープンソースモデル

ホーム

Ai Light Dance Stepmania Ft Wav2vec2 Large Xlsr 53 V7

gary109によって開発

wav2vec2-large-xlsr-53ベースの自動音声認識モデルで、StepManiaゲームオーディオに最適化され、GARY109/AI_LIGHT_DANCEデータセットでファインチューニング済み

音声認識

Transformers

オープンソースライセンス:Apache-2.0 #ダンスリズム認識 #高精度オーディオ分析 #音楽ゲーム適応

ダウンロード数 162

リリース時間 : 6/30/2022

モデル概要

このモデルはStepManiaゲームオーディオに最適化された自動音声認識(ASR)モデルで、wav2vec2-large-xlsr-53アーキテクチャをファインチューニングして実現し、特定のゲームオーディオデータセットで優れた性能を発揮します

モデル特徴

ゲームオーディオ最適化

StepManiaゲームオーディオデータに特化して最適化され、認識効果が向上しています

ファインチューニング版

wav2vec2-large-xlsr-53モデルをベースにファインチューニングし、元モデルの強力な特徴抽出能力を保持しています

低単語誤り率

評価セットで0.6512の単語誤り率(WER)を達成し、優れた性能を示しています

モデル能力

ゲームオーディオ認識

音声からテキストへの変換

リズムゲームオーディオ分析

使用事例

ゲーム開発

StepManiaゲームオーディオ分析

StepManiaゲーム内のオーディオリズムと内容を分析するために使用されます

単語誤り率0.6512

音声認識

特定分野の音声認識

ゲームオーディオなどの特定分野の音声認識タスクに適しています

🚀 ai-light-dance_stepmania_ft_wav2vec2-large-xlsr-53-v7

このモデルは、gary109/ai-light-dance_stepmania_ft_wav2vec2-large-xlsr-53-v6 を GARY109/AI_LIGHT_DANCE - ONSET-STEPMANIA2 データセットでファインチューニングしたバージョンです。評価セットでは以下の結果を達成しています。

損失: 1.0424
単語誤り率 (Wer): 0.6512

📚 ドキュメント

学習手順

学習ハイパーパラメータ

学習中に以下のハイパーパラメータが使用されました。

学習率 (learning_rate): 4e-06
学習バッチサイズ (train_batch_size): 2
評価バッチサイズ (eval_batch_size): 2
シード (seed): 42
オプティマイザ (optimizer): Adam (betas=(0.9,0.999), epsilon=1e-08)
学習率スケジューラの種類 (lr_scheduler_type): linear
学習率スケジューラのウォームアップステップ (lr_scheduler_warmup_steps): 100
エポック数 (num_epochs): 30.0
混合精度学習 (mixed_precision_training): Native AMP

学習結果

学習損失	エポック	ステップ	検証損失	単語誤り率 (Wer)
0.9303	1.0	12031	1.1160	0.6712
0.8181	2.0	24062	1.0601	0.6608
0.7861	3.0	36093	1.0478	0.6520
0.767	4.0	48124	1.0617	0.6526
0.797	5.0	60155	1.0424	0.6512
0.834	6.0	72186	1.0519	0.6542
0.7915	7.0	84217	1.0508	0.6494
0.8106	8.0	96248	1.0753	0.6449
0.7512	9.0	108279	1.1223	0.6592
0.777	10.0	120310	1.1201	0.6535
0.7631	11.0	132341	1.0780	0.6512
0.7465	12.0	144372	1.0822	0.6499
0.826	13.0	156403	1.0706	0.6445
0.7552	14.0	168434	1.0862	0.6449
0.8279	15.0	180465	1.1162	0.6461
0.7769	16.0	192496	1.1023	0.6420
0.7918	17.0	204527	1.1085	0.6456
0.6941	18.0	216558	1.1139	0.6417
0.7379	19.0	228589	1.1126	0.6410
0.7467	20.0	240620	1.1102	0.6369
0.8045	21.0	252651	1.1191	0.6376
0.7059	22.0	264682	1.1285	0.6381
0.7008	23.0	276713	1.1328	0.6377
0.7816	24.0	288744	1.1326	0.6366
0.7426	25.0	300775	1.1420	0.6362
0.7226	26.0	312806	1.1326	0.6350
0.665	27.0	324837	1.1419	0.6346
0.7184	28.0	336868	1.1480	0.6346
0.77	29.0	348899	1.1476	0.6343
0.727	30.0	360930	1.1494	0.6348