Q

Quantized Dia 1.6B Int8

RobAgreesによって開発
Diaは16億パラメータのオープンソーステキスト音声変換モデルで、高度にリアルな対話や非言語表現の生成をサポート
ダウンロード数 69
リリース時間 : 4/28/2025

モデル概要

DiaはNari Labsが開発したテキスト音声変換モデルで、テキストから直接高度にリアルな対話を生成可能。音声入力による感情やトーンの制御をサポートし、笑い声や咳などの非言語表現も生成可能。

モデル特徴

動的int8量子化
動的量子化技術により軽量デプロイと高速推論を実現、推論速度約20%向上
複数話者対話生成
[S1]と[S2]タグを使用して複数キャラクターの対話を生成
非言語表現サポート
笑い声、咳、咳払いなどの非言語表現を生成可能
音声クローン機能
サンプルコードによる音声クローンをサポート

モデル能力

テキスト音声変換
複数話者対話生成
非言語表現生成
音声クローン

使用事例

対話システム
仮想アシスタント
仮想アシスタントのための自然な対話音声を生成
高度にリアルな対話効果を生成
ゲームNPC
ゲームキャラクターのための動的音声対話を生成
複数キャラクターの相互作用と感情表現をサポート
コンテンツ制作
音声コンテンツ制作
ポッドキャスト、オーディオブックなどの対話コンテンツを生成
非言語表現を含む自然な対話を生成可能
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase