K

Kotoba Speech V0.1

由kotoba-tech開發
Kotoba-Speech v0.1 是一個基於12億參數Transformer的日語語音生成模型,支持文本轉語音和單樣本語音克隆。
下載量 23
發布時間 : 3/14/2024

模型概述

該模型是一個端到端的Transformer架構語音生成模型,專注於日語文本轉語音和語音克隆功能。

模型特點

流暢的日語語音生成
能夠將日語文本流暢地轉換為自然語音
單樣本語音克隆
通過語音提示實現僅需一個樣本的語音克隆功能
大參數規模
基於12億參數的Transformer架構,提供高質量的語音生成

模型能力

日語文本轉語音
語音克隆
語音合成

使用案例

語音交互
語音助手
為日語語音助手提供自然流暢的語音輸出
提升用戶體驗的自然度
內容創作
有聲讀物生成
將日語文本自動轉換為有聲讀物
高效生成高質量的語音內容
個性化服務
個性化語音克隆
通過少量樣本克隆特定人物的語音
實現個性化的語音服務
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase