A

Ai Light Dance Stepmania Ft Wav2vec2 Large Xlsr 53 V5

gary109によって開発
wav2vec2-large-xlsr-53をベースにした自動音声認識モデルで、GARY109/AI_LIGHT_DANCEデータセットでファインチューニングされています
ダウンロード数 160
リリース時間 : 6/27/2022

モデル概要

このモデルは自動音声認識(ASR)タスク用にファインチューニングされたバージョンで、AI_LIGHT_DANCEデータセットに最適化されており、音声をテキストに変換できます

モデル特徴

高性能音声認識
評価セットで0.6622の単語誤り率(WER)を達成
wav2vec2アーキテクチャ採用
強力なwav2vec2-large-xlsr-53をベースモデルとして採用
ドメイン最適化
AI_LIGHT_DANCEデータセットで特別にファインチューニング

モデル能力

音声からテキストへの変換
自動音声認識

使用事例

ゲームオーディオ処理
ダンスゲーム音声コマンド認識
ダンスゲーム中の音声コマンドを認識
単語誤り率0.6622
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase