B

Bark Small

Developed by suno
Bark是由Suno开发的基于Transformer的多语言文本转音频模型,能生成逼真语音、音乐及非语言声音
Downloads 22.74k
Release Time : 7/18/2023

Model Overview

基于Transformer架构的文本转音频模型,支持多语言语音合成及背景音效生成,可模拟笑声、叹息等非语言交流

Model Features

多语言支持
支持13种语言的语音合成,包括中文、日语等非拉丁语系语言
非语言表达
可模拟笑声、叹息、哭泣等人类非语言交流声音
背景音效生成
除语音外还能生成音乐、环境噪音等辅助音效
研究友好
提供预训练模型检查点及优化方案,便于学术研究

Model Capabilities

文本转语音
多语言合成
情感音效生成
背景音乐生成
非语言声音模拟

Use Cases

无障碍工具
多语言朗读辅助
为视障用户提供多语言内容语音输出
支持13种语言的流畅语音转换
内容创作
播客音效生成
自动生成带背景音乐的语音内容
可生成带有情感表达和音效的完整音频
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase