D

Dia 1.6B

由nari-labs開發
Dia是由Nari實驗室開發的16億參數文本轉語音模型,能夠直接從文本生成高度逼真的對話,支持情感和語調控制,並能生成非語言交流內容。
下載量 80.28k
發布時間 : 4/20/2025

模型概述

Dia是一款開源權重的文本對話模型,支持通過音頻條件化輸出實現情感和語調控制,並能生成非語言交流內容如笑聲、咳嗽等。

模型特點

高度逼真的對話生成
能夠直接從文本生成高度逼真的對話,支持情感和語調控制。
非語言交流生成
能生成非語言交流內容,如笑聲、咳嗽、清嗓等。
語音克隆
支持語音克隆功能,可通過上傳待克隆音頻實現聲音複製。
開源權重
模型權重完全開源,用戶可完全控制腳本和語音。

模型能力

文本轉語音
情感和語調控制
非語言交流生成
語音克隆

使用案例

對話生成
Dia介紹
生成介紹Dia模型的對話內容
高度逼真的對話效果
緊急預案
生成緊急情況下的對話內容
情感豐富的語音輸出
語音克隆
自定義語音
通過上傳音頻克隆特定聲音
生成與克隆聲音相似的語音
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase