Q

Quantized Dia 1.6B Int8

Developed by RobAgrees
Dia是一款16億參數的開源文本轉語音模型,支持生成高度逼真的對話和非語言表達
Downloads 69
Release Time : 4/28/2025

Model Overview

Dia是由Nari Labs開發的文本轉語音模型,可直接從文本生成高度逼真的對話,支持通過音頻輸入控制情感和語調,還能生成非語言表達如笑聲、咳嗽等。

Model Features

動態int8量化
採用動態量化技術實現更輕量級部署和更快推理,推理速度提升約20%
多說話人對話生成
通過[S1]和[S2]標籤生成多角色對話
非語言表達支持
支持生成笑聲、咳嗽、清嗓等非語言表達
語音克隆功能
支持通過示例代碼實現語音克隆

Model Capabilities

文本轉語音
多說話人對話生成
非語言表達生成
語音克隆

Use Cases

對話系統
虛擬助手
為虛擬助手生成自然對話語音
生成高度逼真的對話效果
遊戲NPC
為遊戲角色生成動態語音對話
支持多角色交互和情感表達
內容創作
有聲內容製作
為播客、有聲書等生成對話內容
可生成包含非語言表達的自然對話
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase