A

Ai Light Dance Singing Ft Wav2vec2 Large Xlsr 53 5gram V1

gary109によって開発
このモデルはwav2vec2-large-xlsr-53を基にした自動音声認識モデルで、GARY109/AI_LIGHT_DANCE - ONSET-SINGINGデータセットでファインチューニングされ、主に歌唱音声認識に使用されます。
ダウンロード数 18
リリース時間 : 6/18/2022

モデル概要

これは歌唱音声認識用の自動音声認識モデルで、wav2vec2-large-xlsr-53アーキテクチャを基にファインチューニングされており、特定の歌唱データセットで優れた性能を発揮します。

モデル特徴

高精度歌唱認識
ONSET-SINGINGデータセットでファインチューニングされ、歌唱音声認識に特化して最適化されています
wav2vec2アーキテクチャ採用
強力なwav2vec2-large-xlsr-53をベースモデルとして採用
低単語誤り率
評価データセットで16.68%の単語誤り率を達成

モデル能力

歌唱音声認識
自動音声文字起こし

使用事例

音楽技術
歌唱内容の文字起こし
歌唱録音を自動的にテキストに変換
単語誤り率16.68%
音楽教育支援
音楽学習者の歌唱発音分析を支援
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase