S

Stt Es Conformer Ctc Large

由nvidia開發
這是一個用於西班牙語自動語音識別(ASR)的大型Conformer-CTC模型,由NVIDIA訓練併發布。
下載量 59
發布時間 : 7/8/2022

模型概述

該模型用於轉錄包含空格的小寫西班牙語字母的語音,基於Conformer架構,使用CTC損失/解碼方法。

模型特點

高性能識別
在多個測試集上表現出色,如Common Voice 7.0測試集WER為5.5%
大訓練數據集
使用1340小時的西班牙語語音數據進行訓練
兼容Riva部署
可與NVIDIA Riva配合使用,實現生產級服務器部署
非自迴歸架構
採用Conformer-CTC的非自迴歸架構,約1.2億參數

模型能力

西班牙語語音識別
音頻轉錄
支持16kHz單聲道音頻輸入

使用案例

語音轉文字
語音轉錄服務
將西班牙語語音內容轉換為文本
高準確率的轉錄結果
語音助手
西班牙語語音助手
用於開發西班牙語語音助手
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase