I

Indri 0.1 124m Tts

由11mlabs開發
Indri 是一個基於Transformer架構的超小型輕量級TTS模型,支持英語和印地語的文本轉語音任務。
下載量 182
發布時間 : 11/12/2024

模型概述

該模型能夠生成高質量的音頻,並保持說話人風格的克隆一致性,支持通過短提示進行語音克隆。

模型特點

超小型輕量級
基於GPT-2小型架構,僅124M參數,可擴展到任何基於自迴歸Transformer的架構
超快速推理
在RTX6000Ada GPU上可達400 tokens/s速度,首次標記時間低於20ms
語音克隆支持
通過短提示(<5秒)即可實現說話人風格克隆
多語言混合支持
支持英語和印地語的代碼混合文本輸入

模型能力

文本轉語音
語音克隆
多語言混合處理

使用案例

語音合成
多語言有聲讀物
為英語和印地語內容生成自然語音
高質量音頻輸出,保持說話人一致性
語音助手
為多語言語音助手提供語音合成能力
支持快速響應的語音生成
教育
語言學習工具
為語言學習者提供發音示例
支持雙語混合發音示範
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase