E

Encodec 32khz

由facebook開發
Meta AI開發的高保真即時神經音頻編解碼器,專為MusicGen項目訓練
下載量 348.00k
發布時間 : 6/15/2023

模型概述

EnCodec是一種利用神經網絡的即時音頻編解碼器,支持高質量音頻壓縮與高效解碼,可與MusicGen模型配合使用

模型特點

高保真音頻壓縮
採用端到端訓練方式,生成高質量音頻樣本,有效減少偽影
即時處理能力
支持流式和非流式兩種工作模式,滿足不同場景需求
創新訓練機制
通過多尺度頻譜對抗器和損失平衡機制實現穩定高效訓練
帶寬可調
支持在編碼和解碼時指定不同帶寬,適應多種應用場景

模型能力

音頻壓縮
音頻解壓縮
即時音頻處理
高質量音頻生成

使用案例

音樂生成
配合MusicGen使用
作為MusicGen模型的音頻編解碼組件
實現高質量音樂生成與壓縮
音頻處理
獨立音頻編解碼
單獨用於音頻文件的壓縮與解壓縮
提供高保真音頻壓縮效果
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase