S

Stt De Conformer Ctc Large

由nvidia開發
這是一個用於德語自動語音識別的大規模Conformer-CTC模型,由NVIDIA訓練並在數千小時的德語語音數據上進行優化。
下載量 132
發布時間 : 6/28/2022

模型概述

該模型能夠轉錄德語語音為小寫字母文本(包括空格),採用Conformer架構的非自迴歸變體,具有約1.2億參數。

模型特點

大規模訓練數據
在數千小時的德語語音數據上訓練,包括VoxPopuli、多語言LibriSpeech和Mozilla Common Voice數據集。
高性能
在多個測試集上表現出色,如Common Voice 7測試集的WER為6.68%。
Riva兼容
與NVIDIA Riva兼容,可用於生產級服務器部署。
非自迴歸架構
採用Conformer的非自迴歸變體,使用CTC損失/解碼,適合高效語音識別。

模型能力

德語語音識別
音頻轉錄
支持16kHz單聲道音頻輸入

使用案例

語音轉錄
會議記錄
將德語會議錄音自動轉錄為文字記錄
高準確率的轉錄文本
語音助手
為德語語音助手提供語音識別能力
即時準確的語音轉文字
媒體處理
字幕生成
為德語視頻內容自動生成字幕
高效準確的同步字幕
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase