X

Xcodec2

HKUSTAudioによって開発
XCodec2は多言語音声の意味理解と高品質音声再構築をサポートする音声トークナイザーです
ダウンロード数 32.36k
リリース時間 : 1/7/2025

モデル概要

XCodec2はLLaMA音声合成に基づく訓練と推論計算規模を最適化した音声トークナイザーで、単一ベクトル量子化、毎秒50トークンの特性を持ち、多言語音声の意味理解と高品質音声再構築をサポートします。

モデル特徴

単一ベクトル量子化
効率的な音声エンコーディングとデコーディングをサポート
効率的なトークン生成
毎秒50トークンを生成可能で、高速な音声処理を実現
多言語サポート
多言語音声の意味理解と再構築をサポート
高品質再構築
高品質な音声再構築が可能

モデル能力

音声エンコーディング
音声デコーディング
音声意味理解
音声再構築

使用事例

音声処理
音声圧縮と再構築
音声信号をトークンに圧縮し、高品質音声に再構築
高品質音声再構築
多言語音声処理
多言語音声の意味理解と処理をサポート
クロスランゲージ音声アプリケーション
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase