B

Bark Small

sunoによって開発
BarkはSunoが開発したTransformerベースの多言語テキストから音声へのモデルで、リアルな音声、音楽、非言語音を生成可能
ダウンロード数 22.74k
リリース時間 : 7/18/2023

モデル概要

Transformerアーキテクチャに基づくテキストから音声へのモデルで、多言語音声合成と背景音響生成をサポート、笑い声やため息などの非言語コミュニケーションをシミュレート

モデル特徴

多言語サポート
中国語、日本語などの非ラテン語系を含む13言語の音声合成をサポート
非言語表現
笑い声、ため息、泣き声などの人間の非言語コミュニケーション音声をシミュレート可能
背景音響生成
音声以外に音楽、環境ノイズなどの補助音響も生成可能
研究フレンドリー
事前学習済みモデルチェックポイントと最適化ソリューションを提供し、学術研究を容易に

モデル能力

テキストから音声
多言語合成
感情音響生成
背景音楽生成
非言語音声シミュレーション

使用事例

アクセシビリティツール
多言語読み上げ支援
視覚障害ユーザー向けに多言語コンテンツの音声出力を提供
13言語の流暢な音声変換をサポート
コンテンツ制作
ポッドキャスト音響生成
背景音楽付き音声コンテンツを自動生成
感情表現と音響を備えた完全なオーディオを生成可能
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase