Kotoba-Speech v0.1開源日語語音生成模型 - 支持文本轉語音與單樣本語音克隆

首頁

Kotoba Speech V0.1

由kotoba-tech開發

Kotoba-Speech v0.1 是一個基於12億參數Transformer的日語語音生成模型，支持文本轉語音和單樣本語音克隆。

語音合成

Transformers

日語開源協議:Apache-2.0 #日語TTS #語音克隆 #12億參數

下載量 23

發布時間 : 3/14/2024

模型概述

該模型是一個端到端的Transformer架構語音生成模型，專注於日語文本轉語音和語音克隆功能。

模型特點

流暢的日語語音生成

能夠將日語文本流暢地轉換為自然語音

單樣本語音克隆

通過語音提示實現僅需一個樣本的語音克隆功能

大參數規模

基於12億參數的Transformer架構，提供高質量的語音生成

模型能力

日語文本轉語音

語音克隆

語音合成

使用案例

語音交互

語音助手

為日語語音助手提供自然流暢的語音輸出

提升用戶體驗的自然度

內容創作

有聲讀物生成

將日語文本自動轉換為有聲讀物

高效生成高質量的語音內容

個性化服務

個性化語音克隆

通過少量樣本克隆特定人物的語音

實現個性化的語音服務

屬性	詳情
模型類型	我們的模型是端到端的Transformer模型。
支持語言	日語
依賴庫	我們將很快發佈訓練代碼。推理和模型代碼主要借鑑自metavoice。

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Kotoba Speech V0.1

模型概述

模型特點

模型能力

使用案例

🚀 Kotoba-Speech-v0.1

🚀 快速開始

✨ 主要特性

📚 詳細文檔

📄 許可證

🙏 致謝