A

Asr Crdnn Rnnlm Librispeech

Developed by speechbrain
これはLibriSpeechデータセットで事前訓練されたエンドツーエンドの自動音声認識システムで、CRDNNアーキテクチャとCTC/注意機構およびRNN言語モデルを組み合わせており、英語音声認識タスクで優れた性能を発揮します。
Downloads 1,354
Release Time : 3/2/2022

Model Overview

このモデルは完全な自動音声認識システムで、トークナイザー、ニューラル言語モデル、音響モデルを含み、英語音声をテキストに変換できます。

Model Features

マルチモジュール統合
トークナイザー、RNN言語モデル、CRDNN音響モデルを統合し、完全な音声認識ソリューションを提供します
デュアルデコード機構
CTCと注意機構を同時に使用してデコードし、認識精度を向上させます
効率的な訓練
LibriSpeechデータセットで訓練され、畳み込みニューラルネットワークブロックと双方向LSTMを使用して音響特徴を抽出します

Model Capabilities

英語音声認識
音声文字起こし
音声からテキストへの変換

Use Cases

音声文字起こし
音声ファイルの文字起こし
英語音声ファイルをテキストに変換します
LibriSpeechテストセットで3.09%の単語誤り率を達成
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase