C

Csm 1b Hf

thomasgauthierによって開発
芝麻科技の会話音声モデル(CSM)のHugging Face実装版、テキスト読み上げと音声クローンタスクをサポート
ダウンロード数 3,974
リリース時間 : 3/26/2025

モデル概要

これは芝麻科技CSM 1BモデルのHugging Face互換バージョンで、公式実装を完全に書き直し、Hugging Faceエコシステムとの完全な統合をサポートしています。推論とトレーニングプロセスを含みます。

モデル特徴

Hugging Face互換
Hugging Faceエコシステムとの互換性のために完全に書き直され、transformersライブラリの全機能をサポート
2段階自己回帰アーキテクチャ
フレーム間処理とフレーム内処理の二段階設計を採用し、長距離依存関係を効果的にモデル化
計算償却トレーニング
デコーダトレーニングの償却技術を採用し、フレームの1-31コードブックのみをトレーニングすることで効率を向上
マルチモーダル入力サポート
交互に配置されたテキストと音声入力データの処理をサポート

モデル能力

テキスト読み上げ合成
音声クローン
マルチコードブック音声トークン化
長距離音声モデリング

使用事例

音声合成
パーソナライズド音声アシスタント
仮想アシスタントのための自然な人間の声を生成
特定の話者特性を持つ音声を生成可能
音声コンテンツ作成
テキストコンテンツを自動的に音声に変換
高品質な音声出力をサポート
音声クローン
パーソナライズド音声クローン
少数のサンプルに基づいて特定の話者の音声特性をクローン
話者の音声を成功裏にクローンできることを示す例
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase