A

Asr Transformer Transformerlm Librispeech

speechbrainによって開発
これはTransformerアーキテクチャに基づく自動音声認識(ASR)システムで、CTCとTransformerデコーダを組み合わせ、LibriSpeech英語データセットでトレーニングされています。
ダウンロード数 533
リリース時間 : 3/2/2022

モデル概要

このモデルはエンドツーエンドの自動音声認識システムで、トークナイザー、ニューラル言語モデル、音響モデルを含み、英語音声の文字起こしをサポートします。

モデル特徴

連合デコード
CTC確率とTransformerデコーダを組み合わせた連合デコードにより、認識精度を向上
サブワード単位処理
unigramトークナイザーを使用して単語をサブワード単位に変換し、モデルの処理能力を向上
高性能
LibriSpeechテストセットで2.27(クリーン)と5.53(その他)の単語誤り率(WER)を達成

モデル能力

英語音声認識
音声文字起こし
自動音声認識

使用事例

音声文字起こし
音声ファイル文字起こし
英語音声ファイルをテキストに変換
高精度な文字起こし結果
音声処理
音声認識システム
音声認識アプリケーションに統合
正確な音声からテキストへの変換機能を提供
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase