A

Ai Light Dance Singing2 Ft Wav2vec2 Large Xlsr 53

gary109によって開発
このモデルは、facebook/wav2vec2-large-xlsr-53をAI Light Danceデータセットでファインチューニングした自動音声認識モデルです。
ダウンロード数 26
リリース時間 : 6/23/2022

モデル概要

これは音声認識用のファインチューニングモデルで、特にAI Light Danceデータセットのsinging2データに最適化されています。

モデル特徴

wav2vec2-large-xlsr-53ベースのファインチューニング
強力な事前学習モデルを基にファインチューニングを行い、特定領域の認識性能を向上させました
singing2データ向け最適化
AI Light Danceデータセットのsinging2データに特化して最適化トレーニングを行いました

モデル能力

音声認識
音声文字起こし

使用事例

音声処理
歌の音声文字起こし
歌唱音声をテキストに変換
単語誤り率0.9386
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase