B

Bark Small

由suno開發
Bark是由Suno開發的基於Transformer的多語言文本轉音頻模型,能生成逼真語音、音樂及非語言聲音
下載量 22.74k
發布時間 : 7/18/2023

模型概述

基於Transformer架構的文本轉音頻模型,支持多語言語音合成及背景音效生成,可模擬笑聲、嘆息等非語言交流

模型特點

多語言支持
支持13種語言的語音合成,包括中文、日語等非拉丁語系語言
非語言表達
可模擬笑聲、嘆息、哭泣等人類非語言交流聲音
背景音效生成
除語音外還能生成音樂、環境噪音等輔助音效
研究友好
提供預訓練模型檢查點及優化方案,便於學術研究

模型能力

文本轉語音
多語言合成
情感音效生成
背景音樂生成
非語言聲音模擬

使用案例

無障礙工具
多語言朗讀輔助
為視障用戶提供多語言內容語音輸出
支持13種語言的流暢語音轉換
內容創作
播客音效生成
自動生成帶背景音樂的語音內容
可生成帶有情感表達和音效的完整音頻
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase