A

Ai Light Dance Stepmania Ft Wav2vec2 Large Xlsr 53 V7

Developed by gary109
基于wav2vec2-large-xlsr-53的自动语音识别模型,专为StepMania游戏音频优化,在GARY109/AI_LIGHT_DANCE数据集上微调
Downloads 162
Release Time : 6/30/2022

Model Overview

该模型是针对StepMania游戏音频优化的自动语音识别(ASR)模型,通过微调wav2vec2-large-xlsr-53架构实现,在特定游戏音频数据集上表现出色

Model Features

游戏音频优化
专门针对StepMania游戏音频数据进行优化,识别效果更佳
微调版本
基于wav2vec2-large-xlsr-53模型微调,保留原模型强大特征提取能力
低词错误率
在评估集上达到0.6512的词错误率(WER),表现优异

Model Capabilities

游戏音频识别
语音转文本
节奏游戏音频分析

Use Cases

游戏开发
StepMania游戏音频分析
用于分析StepMania游戏中的音频节奏和内容
词错误率0.6512
语音识别
特定领域语音识别
适用于游戏音频等特定领域的语音识别任务
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase