K

Kamo Naoyuki Mini An4 Asr Train Raw Bpe Valid.acc.best

espnetによって開発
これはESPnet2フレームワークでトレーニングされた自動音声認識(ASR)事前学習モデルで、mini-an4データセットを使用してトレーニングされ、英語音声認識をサポートします。
ダウンロード数 425
リリース時間 : 3/2/2022

モデル概要

このモデルはエンドツーエンドの自動音声認識モデルで、入力された音声信号を対応するテキスト内容に変換できます。

モデル特徴

エンドツーエンド音声認識
エンドツーエンドアーキテクチャを採用し、音声信号から直接テキストに変換
ESPnetフレームワークベース
成熟したエンドツーエンド音声処理ツールキットであるESPnetを使用してトレーニング
BPEトークン化
バイトペアエンコーディング(BPE)を使用してテキスト処理を実施

モデル能力

英語音声認識
エンドツーエンド音声からテキストへの変換

使用事例

音声文字起こし
会議議事録の文字起こし
英語の会議録音を自動的に文字記録に変換
音声コマンド認識
英語の音声コマンドを認識し、実行可能なコマンドに変換
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase