A

Asr Crdnn Rnnlm Librispeech

speechbrainによって開発
これはLibriSpeechデータセットで事前訓練されたエンドツーエンドの自動音声認識システムで、CRDNNアーキテクチャとCTC/注意機構およびRNN言語モデルを組み合わせており、英語音声認識タスクで優れた性能を発揮します。
ダウンロード数 1,354
リリース時間 : 3/2/2022

モデル概要

このモデルは完全な自動音声認識システムで、トークナイザー、ニューラル言語モデル、音響モデルを含み、英語音声をテキストに変換できます。

モデル特徴

マルチモジュール統合
トークナイザー、RNN言語モデル、CRDNN音響モデルを統合し、完全な音声認識ソリューションを提供します
デュアルデコード機構
CTCと注意機構を同時に使用してデコードし、認識精度を向上させます
効率的な訓練
LibriSpeechデータセットで訓練され、畳み込みニューラルネットワークブロックと双方向LSTMを使用して音響特徴を抽出します

モデル能力

英語音声認識
音声文字起こし
音声からテキストへの変換

使用事例

音声文字起こし
音声ファイルの文字起こし
英語音声ファイルをテキストに変換します
LibriSpeechテストセットで3.09%の単語誤り率を達成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase