E

Encodec 24khz

facebookによって開発
EnCodecはMeta AIが開発した高音質リアルタイムニューラルオーディオコーデックで、エンドツーエンドトレーニング方式を採用し、複数のバンド幅設定をサポートしています。
ダウンロード数 534.08k
リリース時間 : 6/12/2023

モデル概要

EnCodecはニューラルネットワークを利用した高音質オーディオコーデックで、量子化潜在空間とストリーミングエンコーダ-デコーダアーキテクチャによりリアルタイムオーディオ圧縮と解凍を実現します。

モデル特徴

高音質オーディオ圧縮
ニューラルネットワークによる高品質なオーディオ圧縮を実現し、元のオーディオの知覚品質を維持
リアルタイム処理能力
ストリーミングと非ストリーミングの両処理モードをサポートし、様々なリアルタイム性要件に対応
マルチバンド幅サポート
1.5kbpsから12kbpsまでの様々なバンド幅設定で動作可能で、異なるアプリケーションシナリオに適応
エンドツーエンドトレーニング
エンドツーエンドトレーニング方式を採用し、モデルアーキテクチャを簡素化し性能を向上

モデル能力

オーディオ圧縮
オーディオ解凍
リアルタイムオーディオ処理
マルチバンド幅オーディオエンコーディング

使用事例

音声処理
音声通信圧縮
リアルタイム音声通信におけるオーディオ圧縮伝送に使用
3kbpsでOpusの12kbps性能を上回る
音楽ストリーミング
高品質音楽ストリーム配信
音楽ストリーミングサービスにおける効率的なオーディオ圧縮に使用
Transformerモデルにより40%の帯域幅削減を実現
オーディオストレージ
効率的なオーディオストレージ
オーディオファイルの圧縮保存に使用
高音質を維持しながらストレージスペースを大幅に削減
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase