A

Ai Light Dance Stepmania Ft Wav2vec2 Large Xlsr 53 V6

gary109によって開発
このモデルは、GARY109/AI_LIGHT_DANCE - ONSET-STEPMANIA2データセットでwav2vec2-large-xlsr-53をファインチューニングした自動音声認識モデルです。
ダウンロード数 160
リリース時間 : 6/28/2022

モデル概要

これは自動音声認識(ASR)のためのモデルで、Stepmaniaゲームのオーディオデータに特化して最適化されています。

モデル特徴

wav2vec2アーキテクチャベース
wav2vec2-large-xlsr-53をベースモデルとして使用し、優れた音声認識能力を備えています
ゲームオーディオ向け最適化
Stepmaniaゲームオーディオデータセットで特別にファインチューニングされており、ゲームシナリオの音声認識に適しています
マルチエポックトレーニング
10エポックのトレーニングを経て、検証損失は約1.0で安定し、単語誤り率は約0.65です

モデル能力

音声認識
オーディオ文字起こし
ゲームオーディオ処理

使用事例

ゲーム
Stepmaniaゲーム音声認識
Stepmaniaゲーム内の音声コマンドを認識
単語誤り率約0.65
音声文字起こし
ゲームオーディオ文字起こし
ゲーム内の音声コンテンツをテキストに変換
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase