Q

Quantized Dia 1.6B Int8

由RobAgrees開發
Dia是一款16億參數的開源文本轉語音模型,支持生成高度逼真的對話和非語言表達
下載量 69
發布時間 : 4/28/2025

模型概述

Dia是由Nari Labs開發的文本轉語音模型,可直接從文本生成高度逼真的對話,支持通過音頻輸入控制情感和語調,還能生成非語言表達如笑聲、咳嗽等。

模型特點

動態int8量化
採用動態量化技術實現更輕量級部署和更快推理,推理速度提升約20%
多說話人對話生成
通過[S1]和[S2]標籤生成多角色對話
非語言表達支持
支持生成笑聲、咳嗽、清嗓等非語言表達
語音克隆功能
支持通過示例代碼實現語音克隆

模型能力

文本轉語音
多說話人對話生成
非語言表達生成
語音克隆

使用案例

對話系統
虛擬助手
為虛擬助手生成自然對話語音
生成高度逼真的對話效果
遊戲NPC
為遊戲角色生成動態語音對話
支持多角色交互和情感表達
內容創作
有聲內容製作
為播客、有聲書等生成對話內容
可生成包含非語言表達的自然對話
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase