I

Indri 0.1 124m Tts

11mlabsによって開発
IndriはTransformerアーキテクチャに基づく超小型軽量級TTSモデルで、英語とヒンディー語のテキスト読み上げタスクをサポートします。
ダウンロード数 182
リリース時間 : 11/12/2024

モデル概要

このモデルは高品質な音声を生成でき、話者のスタイルクローン一貫性を維持し、短いプロンプトによる音声クローンをサポートします。

モデル特徴

超小型軽量級
GPT-2小型アーキテクチャベースで124Mパラメータのみ、自己回帰型Transformerベースのあらゆるアーキテクチャに拡張可能
超高速推論
RTX6000Ada GPUで400 tokens/sの速度を達成、初回トークン時間20ms未満
音声クローンサポート
短いプロンプト(<5秒)で話者スタイルクローンを実現
多言語混合サポート
英語とヒンディー語のコード混合テキスト入力をサポート

モデル能力

テキスト読み上げ
音声クローン
多言語混合処理

使用事例

音声合成
多言語オーディオブック
英語とヒンディー語コンテンツの自然な音声を生成
高品質な音声出力、話者一貫性を維持
音声アシスタント
多言語音声アシスタントに音声合成機能を提供
高速応答の音声生成をサポート
教育
言語学習ツール
言語学習者に発音例を提供
バイリンガル混合発音デモをサポート
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase