E

Encodec 32khz

facebookによって開発
Meta AIが開発した高忠実度リアルタイムニューラル音声コーデックで、MusicGenプロジェクト向けにトレーニング
ダウンロード数 348.00k
リリース時間 : 6/15/2023

モデル概要

EnCodecはニューラルネットワークを利用したリアルタイム音声コーデックで、高品質な音声圧縮と効率的なデコードをサポートし、MusicGenモデルと連携可能

モデル特徴

高忠実度音声圧縮
エンドツーエンドのトレーニング方式を採用し、高品質な音声サンプルを生成、アーティファクトを効果的に低減
リアルタイム処理能力
ストリーミングと非ストリーミングの2つの動作モードをサポートし、様々なシナリオに対応
革新的なトレーニングメカニズム
マルチスケールスペクトル敵対器と損失バランス機構により、安定かつ効率的なトレーニングを実現
バンド幅調整可能
エンコードとデコード時に異なるバンド幅を指定可能で、多様なアプリケーションシーンに適応

モデル能力

音声圧縮
音声解凍
リアルタイム音声処理
高品質音声生成

使用事例

音楽生成
MusicGenとの連携使用
MusicGenモデルの音声コーデックコンポーネントとして
高品質な音楽生成と圧縮を実現
音声処理
独立音声コーデック
単独で音声ファイルの圧縮と解凍に使用
高忠実度な音声圧縮効果を提供
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase