F

Free Svc

alefiuryによって開発
FreeSVCは多言語対応のゼロショット歌声変換モデルで、特定の言語に対して大量のトレーニングを行うことなく、言語横断的な歌声変換を実現できます。
ダウンロード数 27
リリース時間 : 1/7/2025

モデル概要

FreeSVCは強化版VITSアーキテクチャを採用し、話者非依存クラスタリング(SPIN)技術とECAPA2話者エンコーダーを統合しています。これにより、話者特徴と言語内容を効果的に分離し、複数言語にわたる高品質で自然な音色変換を保証します。

モデル特徴

多言語サポート
中国語、英語、日本語などの主要言語を含む11言語のゼロショット変換をサポート
言語横断変換能力
特定の言語向けのトレーニングなしで言語横断的な歌声変換を実現
高品質音色維持
SPIN技術とECAPA2エンコーダーにより話者特徴と言語内容を効果的に分離
多様なトレーニングデータ
音声と歌唱データを含む12以上の異なるデータセットを使用してトレーニング

モデル能力

音声変換
歌声変換
音声クローン
歌声クローン
言語横断変換
ゼロショット学習

使用事例

音楽制作
多言語歌曲カバー
歌曲をある言語から別の言語に変換し、元の歌手の音色特徴を維持
自然で流暢な言語横断歌曲変換を実現
バーチャルシンガー音色カスタマイズ
バーチャルシンガーに独自の音色特徴を作成
特定の音色特徴を持つ歌唱音声を生成
音声技術研究
言語横断音声変換研究
異なる言語間の音声特徴変換を研究するために使用
音声変換技術の研究プラットフォームを提供
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase