E

Encodec 48khz

facebookによって開発
EnCodecはMeta AIが開発したリアルタイム高音質ニューラルオーディオコーデックで、複数の帯域幅設定とストリーミング処理をサポートしています。
ダウンロード数 23.25k
リリース時間 : 6/12/2023

モデル概要

ニューラルネットワークベースのエンドツーエンドオーディオコーデックで、量子化潜在空間とマルチスケールスペクトル敵対器を採用し、リアルタイムオーディオ圧縮/解凍をサポートします。

モデル特徴

マルチスケールスペクトル敵対トレーニング
単一の敵対器でトレーニングプロセスを簡素化し、アーティファクトを効果的に削減して生成品質を向上
動的損失バランス
革新的なハイパーパラメータと損失スケールの分離により、トレーニング安定性を大幅に向上
ストリーミング処理サポート
重み正規化と左詰め技術により連続オーディオストリームのリアルタイム処理を実現
帯域幅設定可能
1.5kbpsから12kbpsまでの複数の圧縮率をサポートし、様々なアプリケーションシナリオに対応

モデル能力

リアルタイムオーディオ圧縮
高音質オーディオ再構築
ストリーミングオーディオ処理
マルチ帯域幅設定

使用事例

オーディオ通信
低帯域幅音声伝送
限られたネットワーク条件下で高品質な音声通話を実現
3kbpsバージョンはOpus 12kbpsを上回る性能
メディアサービス
音楽ストリーミング
高音質を維持しながら音楽コンテンツを効率的に圧縮
言語モデルと組み合わせると帯域幅を25-40%削減可能
生成AI
音声合成
TTSシステムの調整可能なコンポーネントとして使用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase