D

Dia 1.6B

nari-labsによって開発
DiaはNari Labsが開発した16億パラメータのテキスト音声合成モデルで、テキストから高度にリアルな対話を直接生成でき、感情やイントネーションの制御をサポートし、非言語コミュニケーション内容も生成可能です。
ダウンロード数 80.28k
リリース時間 : 4/20/2025

モデル概要

Diaはオープンソースのテキスト対話モデルで、音声条件付けによる感情・イントネーション制御をサポートし、笑い声や咳などの非言語コミュニケーション内容も生成できます。

モデル特徴

高度にリアルな対話生成
テキストから直接高度にリアルな対話を生成でき、感情やイントネーションの制御をサポートします。
非言語コミュニケーション生成
笑い声、咳、喉の鳴らし音などの非言語コミュニケーション内容を生成できます。
音声クローニング
音声クローニング機能をサポートし、クローン対象の音声をアップロードすることで声の複製が可能です。
オープンソースの重み
モデルの重みは完全にオープンソースで、ユーザーはスクリプトと音声を完全に制御できます。

モデル能力

テキスト音声合成
感情・イントネーション制御
非言語コミュニケーション生成
音声クローニング

使用事例

対話生成
Dia紹介
Diaモデルを紹介する対話内容を生成
高度にリアルな対話効果
緊急対応
緊急時の対話内容を生成
感情豊かな音声出力
音声クローニング
カスタム音声
音声をアップロードして特定の声をクローン
クローン音声に似た音声を生成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase