dia-ggufオープンソーステキストトゥスピーチモデル - 量子化形式をサポートし、簡単に音声変換を実現！

Dia Gguf

calcuisによって開発

nari-labs/Dia-1.6Bを基にしたテキスト音声変換モデルで、GGUF量子化形式をサポートし、gguf-connectorツールで実行可能です。

ダウンロード数 100

リリース時間 : 5/16/2025

モデル概要

これはオープンソースのテキスト音声変換モデルで、会話型音声合成をサポートし、ユーザーはスクリプトと音声出力を完全に制御できます。

GGUF量子化サポート

FP8/16/32など多様な量子化形式をサポートし、モデル実行効率を最適化

会話型音声合成

マルチキャラクター会話シーンの音声合成をサポート

オフライン実行能力

モデルダウンロード後、完全にオフラインで実行可能

テキスト音声変換

マルチキャラクター会話音声合成

オフライン音声生成

音声インタラクションアプリケーション

対話システム音声出力

対話システムに自然な音声出力を提供

サンプル音声は流暢なマルチキャラクター会話効果を示しています

コンテンツ音声化

テキストコンテンツを音声に変換

プロンプト	音声サンプル
`[S1] This is an open weights text to dialogue model.` `[S2] You get full control over scripts and voices.` `[S1] Wow. Amazing. (laughs)` `[S2] Try it now on Git hub or Hugging Face.`	🎧 dia-sample-1
`[S1] Hey Connector, why your appearance looks so stupid?` `[S2] Oh, really? maybe I ate too much smart beans.` `[S1] Wow. Amazing. (laughs)` `[S2] Let's go to get some more smart beans and you will become stupid as well.`	🎧 dia-sample-2

プロパティ	詳細
モデルタイプ	gguf量子化およびfp8/16/32スケーリングされたdia-1.6b
ベースモデル	nari-labs/Dia-1.6B
パイプラインタグ	テキストから音声への合成
タグ	gguf-connector