C

Canary Tts 150m

2121-8によって開発
llm-jp/llm-jp-3-150m-instruct3をベースに訓練した日本語TTS音声合成システムで、プロンプトによる音質制御が可能
ダウンロード数 36
リリース時間 : 4/22/2025

モデル概要

実験的な日本語音声合成モデルで、Parler-TTSプロンプトアーキテクチャとXCodec2オーディオデコーダを採用し、プロンプト制御でピッチや背景ノイズを調整可能

モデル特徴

プロンプト制御
制御プロンプトと読み上げプロンプトの変更で音質を微調整可能
軽量化設計
150Mパラメータ規模でリソース制約環境に適している
高品質音声出力
XCodec2オーディオデコーダ採用で音声品質を保証

モデル能力

日本語音声合成
ピッチ調整
背景ノイズ制御
テキスト読み上げ

使用事例

音声インタラクション
仮想アシスタント
日本語仮想アシスタント向けに自然な音声出力を提供
感情特徴を含む音声を生成可能
コンテンツ制作
音声コンテンツ生成
日本語テキストを自動で音声に変換
異なる声色やイントネーションの音声出力をサポート
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase