I

Indri 0.1 124m Tts

由 11mlabs 开发
Indri 是一个基于Transformer架构的超小型轻量级TTS模型,支持英语和印地语的文本转语音任务。
下载量 182
发布时间 : 11/12/2024

模型简介

该模型能够生成高质量的音频,并保持说话人风格的克隆一致性,支持通过短提示进行语音克隆。

模型特点

超小型轻量级
基于GPT-2小型架构,仅124M参数,可扩展到任何基于自回归Transformer的架构
超快速推理
在RTX6000Ada GPU上可达400 tokens/s速度,首次标记时间低于20ms
语音克隆支持
通过短提示(<5秒)即可实现说话人风格克隆
多语言混合支持
支持英语和印地语的代码混合文本输入

模型能力

文本转语音
语音克隆
多语言混合处理

使用案例

语音合成
多语言有声读物
为英语和印地语内容生成自然语音
高质量音频输出,保持说话人一致性
语音助手
为多语言语音助手提供语音合成能力
支持快速响应的语音生成
教育
语言学习工具
为语言学习者提供发音示例
支持双语混合发音示范
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase