A

Asr Hubert Cluster Bart Base

voidfulによって開発
HubertとBARTアーキテクチャに基づく自動音声認識モデルで、クラスタリング特徴変換を通じて音声からテキストへの変換を実現します。
ダウンロード数 13
リリース時間 : 3/2/2022

モデル概要

このモデルは、Hubertの音声特徴抽出能力とBARTのシーケンス間変換能力を組み合わせ、自動音声認識(ASR)タスクに特化しています。

モデル特徴

Hubert特徴クラスタリング
Hubertを使用して音声特徴を抽出し、k - meansクラスタリングでエンコードします。
BARTシーケンス変換
BARTモデルを利用してクラスタリング特徴シーケンスをテキストシーケンスに変換します。
効率的な音声処理
様々なサンプリングレートの音声入力を処理し、テキストに変換できます。

モデル能力

英語音声認識
音声特徴抽出
シーケンスからテキストへの変換

使用事例

音声文字起こし
講演の文字起こし
講演の録音を文字記録に変換します。
サンプル結果:「泥濘の田舎道を進み、湿った校舎で濡れた聴衆に向かって2週間連続で講演し...」
音声アシスタント
音声コマンド認識
ユーザーの音声コマンドを認識し、実行可能なコマンドに変換します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase