S

Stable Audio Open Small

stabilityaiによって開発
テキストプロンプトに基づいて最大11秒の44.1kHzステレオオーディオを生成する拡散モデル
ダウンロード数 1,171
リリース時間 : 5/12/2025

モデル概要

このモデルはテキスト記述に基づいて高品質なショートオーディオクリップを生成でき、オートエンコーダ、テキスト埋め込みモジュール、Transformerベースの拡散モデルの3つのコアコンポーネントを含みます

モデル特徴

高品質オーディオ生成
44.1kHz CD品質のステレオオーディオクリップを生成可能
テキスト条件制御
T5テキスト埋め込みによりテキストからオーディオへの精密な制御を実現
高速推論
8ステップサンプリングをサポートし効率的な生成を実現
著作権準拠
トレーニングデータは厳格な著作権スクリーニングを経ており、CCライセンスコンテンツのみを使用

モデル能力

テキストガイドオーディオ生成
音楽クリップ生成
サウンドエフェクト生成
ショートオーディオループ生成

使用事例

クリエイティブ制作
バックグラウンドミュージック生成
ビデオプロジェクト向けにカスタムバックグラウンドミュージックを迅速に生成
11秒以内の音楽ループクリップ
サウンドエフェクトデザイン
テキスト記述に基づいて特定のサウンドエフェクトを生成
高品質なサウンドエフェクトクリップ
研究実験
生成モデル研究
オーディオ生成モデルの限界と可能性を探求
オーディオAI分野の発展を推進
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase