I

Indri 0.1 124m Tts

Developed by 11mlabs
Indri 是一個基於Transformer架構的超小型輕量級TTS模型,支持英語和印地語的文本轉語音任務。
Downloads 182
Release Time : 11/12/2024

Model Overview

該模型能夠生成高質量的音頻,並保持說話人風格的克隆一致性,支持通過短提示進行語音克隆。

Model Features

超小型輕量級
基於GPT-2小型架構,僅124M參數,可擴展到任何基於自迴歸Transformer的架構
超快速推理
在RTX6000Ada GPU上可達400 tokens/s速度,首次標記時間低於20ms
語音克隆支持
通過短提示(<5秒)即可實現說話人風格克隆
多語言混合支持
支持英語和印地語的代碼混合文本輸入

Model Capabilities

文本轉語音
語音克隆
多語言混合處理

Use Cases

語音合成
多語言有聲讀物
為英語和印地語內容生成自然語音
高質量音頻輸出,保持說話人一致性
語音助手
為多語言語音助手提供語音合成能力
支持快速響應的語音生成
教育
語言學習工具
為語言學習者提供發音示例
支持雙語混合發音示範
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase