A

Ai Light Dance Stepmania Ft Wav2vec2 Large Xlsr 53 V7

gary109によって開発
wav2vec2-large-xlsr-53ベースの自動音声認識モデルで、StepManiaゲームオーディオに最適化され、GARY109/AI_LIGHT_DANCEデータセットでファインチューニング済み
ダウンロード数 162
リリース時間 : 6/30/2022

モデル概要

このモデルはStepManiaゲームオーディオに最適化された自動音声認識(ASR)モデルで、wav2vec2-large-xlsr-53アーキテクチャをファインチューニングして実現し、特定のゲームオーディオデータセットで優れた性能を発揮します

モデル特徴

ゲームオーディオ最適化
StepManiaゲームオーディオデータに特化して最適化され、認識効果が向上しています
ファインチューニング版
wav2vec2-large-xlsr-53モデルをベースにファインチューニングし、元モデルの強力な特徴抽出能力を保持しています
低単語誤り率
評価セットで0.6512の単語誤り率(WER)を達成し、優れた性能を示しています

モデル能力

ゲームオーディオ認識
音声からテキストへの変換
リズムゲームオーディオ分析

使用事例

ゲーム開発
StepManiaゲームオーディオ分析
StepManiaゲーム内のオーディオリズムと内容を分析するために使用されます
単語誤り率0.6512
音声認識
特定分野の音声認識
ゲームオーディオなどの特定分野の音声認識タスクに適しています
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase