K

Kamo Naoyuki Mini An4 Asr Train Raw Bpe Valid.acc.best

由espnet開發
這是一個基於ESPnet2框架訓練的自動語音識別(ASR)預訓練模型,使用mini-an4數據集訓練,支持英文語音識別。
下載量 425
發布時間 : 3/2/2022

模型概述

該模型是一個端到端的自動語音識別模型,能夠將輸入的語音信號轉換為對應的文本內容。

模型特點

端到端語音識別
採用端到端架構,直接從語音信號轉換為文本
基於ESPnet框架
使用ESPnet這一成熟的端到端語音處理工具包訓練
BPE分詞
使用字節對編碼(BPE)進行文本處理

模型能力

英語語音識別
端到端語音轉文本

使用案例

語音轉錄
會議記錄轉錄
將英語會議錄音自動轉換為文字記錄
語音指令識別
識別英語語音指令並轉換為可執行命令
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase