E

Encodec 24khz

由facebook開發
EnCodec是由Meta AI開發的高保真即時神經音頻編解碼器,採用端到端訓練方式,支持多種帶寬設置。
下載量 534.08k
發布時間 : 6/12/2023

模型概述

EnCodec是一種利用神經網絡的高保真音頻編解碼器,通過量化潛在空間和流式編碼器-解碼器架構實現即時音頻壓縮與解壓縮。

模型特點

高保真音頻壓縮
通過神經網絡實現高質量的音頻壓縮,保持原始音頻的感知質量
即時處理能力
支持流式和非流式兩種處理模式,滿足不同即時性需求
多帶寬支持
可在1.5kbps到12kbps等多種帶寬設置下工作,適應不同應用場景
端到端訓練
採用端到端訓練方式,簡化模型架構並提高性能

模型能力

音頻壓縮
音頻解壓縮
即時音頻處理
多帶寬音頻編碼

使用案例

語音處理
語音通信壓縮
用於即時語音通信中的音頻壓縮傳輸
在3kbps下性能優於Opus在12kbps的表現
音樂流媒體
高質量音樂流傳輸
用於音樂流媒體服務中的高效音頻壓縮
通過Transformer模型可實現40%帶寬減少
音頻存儲
高效音頻存儲
用於音頻文件的壓縮存儲
保持高保真同時顯著減少存儲空間
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase