F

Fish Agent V0.1 3b

由fishaudio開發
一款突破性的語音轉語音模型,能夠精確捕捉並生成環境音頻信息,同時具備先進的文本轉語音能力。
下載量 653
發布時間 : 10/29/2024

模型概述

魚語智能代理 V0.1 3B版是一款多功能語音處理模型,支持語音轉語音和文本轉語音任務,採用無語義標記的架構設計,無需依賴傳統語義編碼器/解碼器。

模型特點

無語義標記架構
無需依賴Whisper或CosyVoice等傳統語義編碼器/解碼器,實現更高效的語音處理
多語言支持
支持8種語言的語音處理,包括中文、英語等主要語言
大規模訓練數據
基於70萬小時的多語言音頻數據集訓練,確保模型性能
多功能語音處理
同時支持語音轉語音和文本轉語音任務,應用場景廣泛

模型能力

語音轉語音
文本轉語音
語音轉文本
多語言語音處理

使用案例

語音合成
多語言語音合成
將文本轉換為自然流暢的語音輸出
支持8種語言的語音合成
語音轉換
語音風格轉換
將輸入語音轉換為不同風格或特性的輸出語音
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase