Tango2 Full
T
Tango2 Full
Developed by declare-lab
Tango 2是基於Tango改進的文本轉音頻生成模型,通過直接偏好優化(DPO)技術實現音頻生成的對齊訓練
Downloads 63
Release Time : 4/13/2024
Model Overview
Tango 2是一個擴散式文本轉音頻生成模型,在Tango-full-ft檢查點基礎上,使用Audio-alpaca配對的文本-音頻偏好數據集進行DPO對齊訓練,能夠根據文本描述生成高質量的音頻
Model Features
直接偏好優化(DPO)
使用DPO技術對模型進行對齊訓練,提高生成音頻的質量和與文本描述的匹配度
擴展訓練數據集
在擴展版Audio-alpaca數據集上進行訓練,增強模型的泛化能力
高質量音頻生成
支持100-200步採樣,可生成高質量的音頻效果
Model Capabilities
文本到音頻轉換
批量音頻生成
場景音效合成
Use Cases
多媒體制作
音效生成
根據文本描述自動生成特定場景的音效
可生成如雷聲、歡呼聲等高質量音效
背景音樂合成
根據場景描述生成匹配的背景音樂
遊戲開發
遊戲音效製作
快速生成各種遊戲場景所需的音效
Featured Recommended AI Models
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers Supports Multiple Languages

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers English

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 Chinese
R
uer
2,694
98