C

Csm Expressiva 1b

senstellaによって開発
CSM-1b対話音声モデルをファインチューニングした感情音声モデルで、ささやきスタイルの音声合成をサポート
ダウンロード数 105
リリース時間 : 4/10/2025

モデル概要

本モデルはSFTファインチューニングによりCSMベースモデルを調整し、Expressoデータセットのささやきスタイル音声データを使用して、csm-mlxコードベースのLoRAファインチューニング効果を検証しました。特定の感情特徴を持つ音声を生成できます。

モデル特徴

ささやきスタイル音声合成
特定のささやきスタイルを持つ感情音声を生成可能
LoRAファインチューニング最適化
低ランク適応(LoRA)技術を使用した効率的なファインチューニングにより、ベースモデルの能力を維持しながら新機能を追加
軽量トレーニング
16GBメモリのMacBook Airでトレーニング可能で、リソースが限られた環境に適している
安定性向上
ファインチューニングによりベースモデルの典型的な故障(無限の無音など)を大幅に減少

モデル能力

テキストから音声へ
感情音声合成
ささやきスタイル生成

使用事例

音声合成
感情的音声アシスタント
音声アシスタントにささやきなどの感情的音声出力機能を追加
自然な感情音声を生成可能
音声コンテンツ制作
オーディオブック、ポッドキャストなどのコンテンツ制作に多様な音声スタイルを提供
特定スタイルの音声コンテンツを生成可能
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase