A

Ai Light Dance Singing Ft Wav2vec2 Large Xlsr 53

gary109によって開発
このモデルは、AI_LIGHT_DANCE - ONSET-SINGINGデータセットでfacebook/wav2vec2-large-xlsr-53をファインチューニングした自動音声認識モデルで、主に歌唱音声認識タスクに使用されます。
ダウンロード数 23
リリース時間 : 6/15/2022

モデル概要

これは歌唱音声認識タスク向けに最適化された自動音声認識モデルで、wav2vec2-large-xlsr-53アーキテクチャを基にファインチューニングされており、評価セットで20.43%の単語誤り率を達成しました。

モデル特徴

歌唱音声認識最適化
歌唱音声に特化してファインチューニングされており、一般的な音声認識モデルと比べて歌唱シーンで優れた性能を発揮します
低い単語誤り率
評価セットで20.43%の単語誤り率を達成し、良好な性能を示しています
XLSRアーキテクチャ採用
大規模な多言語音声表現学習の事前学習モデルを基盤としています

モデル能力

歌唱音声認識
音声からテキストへの変換
音楽コンテンツ分析

使用事例

音楽分析
歌詞の文字起こし
歌唱録音を自動的に歌詞テキストに変換します
単語誤り率20.43%
音楽コンテンツ検索
歌詞内容を通じて音楽フラグメントを検索します
音楽教育
歌唱練習評価
歌唱録音と標準歌詞の一致度を分析します
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase