H

Hubert Large Ll60k

facebookによって開発
HuBERTは自己教師あり音声表現学習モデルで、オフラインクラスタリングステップによりBERT風予測損失のためのアライメント目標ラベルを提供し、音声認識、生成、圧縮タスクに適しています。
ダウンロード数 30.99k
リリース時間 : 3/2/2022

モデル概要

HuBERT(隠れユニットBERT)は革新的なマスキング予測損失とクラスタリング手法を用いた自己教師あり音声表現学習フレームワークで、音声認識タスクで優れた性能を発揮します。

モデル特徴

自己教師あり学習
ラベル付けデータなしで事前学習が可能で、革新的なマスキング予測損失を通じて音声表現を学習
2段階クラスタリング
初期k-meansクラスタリングと反復最適化により、安定した予測目標ラベルを生成
効率的な表現
LibrispeechとLibri-lightベンチマークでwav2vec 2.0の性能を凌駕
大規模トレーニング
10分から6万時間までのトレーニングデータ規模に対応

モデル能力

音声表現学習
音声認識
音声生成
音声圧縮

使用事例

音声技術
音声認識システム
HuBERTモデルを微調整して高精度な音声認識システムを構築
Librispeechテストセットで13-19%の単語誤り率削減を実現
音声合成フロントエンド
学習された音声表現を活用して音声合成システムのフロントエンド処理を改善
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase