H

Hubert Xlarge Ls960 Ft

facebookによって開発
Librispeechの960時間の音声データで微調整されたHubert超大型音声認識モデルで、LibriSpeechテストセットでのWERはわずか1.8です。
ダウンロード数 8,160
リリース時間 : 3/2/2022

モデル概要

このモデルは、Facebookが開発したHubert自己教師付き音声表現学習モデルの微調整バージョンで、英語の自動音声認識タスクに特化しています。

モデル特徴

自己教師付き学習
HuBERTの自己教師付き学習方法を採用し、オフラインクラスタリングステップによってBERT形式の予測損失目標を提供します。
高性能
LibriSpeech cleanテストセットでのWERはわずか1.8で、性能が優れています。
大規模学習
Librispeechの960時間の音声データを基に微調整されています。

モデル能力

英語音声認識
16kHzサンプリングレートの音声処理

使用事例

音声文字起こし
会議記録の文字起こし
英語の会議録音を自動的に文字起こしします。
高い正確率での文字起こし結果
音声コンテンツの索引付け
音声コンテンツに検索可能な文字索引を作成します。
音声コンテンツの検索可能性を向上させます。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase