S

Stable Audio Open 1.0

stabilityaiによって開発
Stable Audio Open 1.0はテキストからオーディオを生成するモデルで、テキストプロンプトに基づいて最大47秒の44.1kHzステレオオーディオを生成できます。
ダウンロード数 36.03k
リリース時間 : 5/24/2024

モデル概要

このモデルはテキスト記述を高品質なオーディオクリップに変換でき、クリエイティブなオーディオ生成や研究用途に適しています。

モデル特徴

高品質オーディオ生成
44.1kHzのステレオオーディオを生成可能で、最大47秒まで対応しています。
テキスト条件制御
T5テキスト埋め込みモジュールを使用して、正確なテキストからオーディオへの変換を実現します。
拡散モデル技術
Transformerベースの拡散モデル(DiT)を採用し、潜在空間でオーディオ生成を行います。

モデル能力

テキストからオーディオ生成
ステレオオーディオ合成
条件付きオーディオ生成

使用事例

クリエイティブオーディオ制作
音楽クリップ生成
テキスト記述に基づいて特定のスタイルの音楽クリップを生成します。
44.1kHzステレオオーディオを生成
サウンドエフェクトデザイン
ハンマーで木の表面を叩く音など、特定のサウンドエフェクトを生成します。
高品質なサウンドエフェクト生成
研究応用
オーディオ生成アルゴリズム研究
テキストからオーディオを生成するアルゴリズムとモデルの研究に使用します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase