C

Csm Expressiva 1b

Developed by senstella
CSM-1b対話音声モデルをファインチューニングした感情音声モデルで、ささやきスタイルの音声合成をサポート
Downloads 105
Release Time : 4/10/2025

Model Overview

本モデルはSFTファインチューニングによりCSMベースモデルを調整し、Expressoデータセットのささやきスタイル音声データを使用して、csm-mlxコードベースのLoRAファインチューニング効果を検証しました。特定の感情特徴を持つ音声を生成できます。

Model Features

ささやきスタイル音声合成
特定のささやきスタイルを持つ感情音声を生成可能
LoRAファインチューニング最適化
低ランク適応(LoRA)技術を使用した効率的なファインチューニングにより、ベースモデルの能力を維持しながら新機能を追加
軽量トレーニング
16GBメモリのMacBook Airでトレーニング可能で、リソースが限られた環境に適している
安定性向上
ファインチューニングによりベースモデルの典型的な故障(無限の無音など)を大幅に減少

Model Capabilities

テキストから音声へ
感情音声合成
ささやきスタイル生成

Use Cases

音声合成
感情的音声アシスタント
音声アシスタントにささやきなどの感情的音声出力機能を追加
自然な感情音声を生成可能
音声コンテンツ制作
オーディオブック、ポッドキャストなどのコンテンツ制作に多様な音声スタイルを提供
特定スタイルの音声コンテンツを生成可能
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase