MOSS-TTSD-v0.5開源雙語口語合成模型 - 免費將對話腳本轉為自然語音

首頁

MOSS TTSD V0.5

由fnlp開發

MOSS-TTSD 是一個開源的雙語口語對話合成模型，支持中文和英文，能夠將對話腳本轉化為自然、富有表現力的對話語音。

語音合成

Safetensors

支持多種語言開源協議:Apache-2.0 #雙語對話合成 #零樣本語音克隆 #高表現力語音

下載量 182

發布時間 : 7/4/2025

模型概述

MOSS-TTSD 是一個文本轉口語對話（TTSD）模型，專門用於生成兩人之間的自然對話語音，適用於AI播客製作等場景。

模型特點

高度富有表現力的對話語音

基於數百萬小時的TTS數據及40萬小時的合成和真實對話語音訓練，能生成類似人類的對話語音，具有自然的對話韻律。

雙說話人語音克隆

支持零樣本雙說話人語音克隆，並能根據對話腳本準確切換說話人。

中英雙語支持

能夠生成富有表現力的中文和英文語音。

長語音生成

能夠單會話生成最長達960秒的語音。

完全開源且可商用

採用Apache-2.0許可證，支持免費商業使用。

模型能力

文本轉語音

對話語音合成

雙語語音生成

語音克隆

長語音生成

使用案例

內容創作

AI播客製作

將對話腳本自動轉換為自然流暢的播客語音

生成富有表現力的對話語音，提升聽眾體驗

語音交互

虛擬助手對話

為虛擬助手生成更自然的對話語音

提高人機交互的自然度和友好性

屬性	詳情
基礎模型	Qwen/Qwen3 - 1.7B - Base
任務類型	文本轉語音
許可證	Apache-2.0

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

MOSS TTSD V0.5

模型概述

模型特點

模型能力

使用案例

🚀 MOSS-TTSD

🚀 快速開始

✨ 主要特性

📄 許可證

🔍 信息表格