X

Xcodec2

由HKUSTAudio開發
XCodec2是一款支持多語言語音語義理解與高質量語音重建的語音標記器
下載量 32.36k
發布時間 : 1/7/2025

模型概述

XCodec2是一款基於LLaMA語音合成的訓練與推理計算規模優化的語音標記器,具有單向量量化、每秒50個標記的特性,支持多語言語音語義理解與高質量語音重建。

模型特點

單向量量化
支持高效的語音編碼與解碼
高效標記生成
每秒可生成50個標記,實現快速語音處理
多語言支持
支持多語言語音語義理解與重建
高質量重建
能夠實現高質量的語音重建

模型能力

語音編碼
語音解碼
語音語義理解
語音重建

使用案例

語音處理
語音壓縮與重建
將語音信號壓縮為標記並重建為高質量語音
高質量語音重建
多語言語音處理
支持多語言語音的語義理解與處理
跨語言語音應用
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase