S

Stt Rw Conformer Transducer Large

由nvidia開發
這是一個用於盧旺達語語音識別的Conformer-Transducer大型模型,能將語音轉錄為小寫拉丁字母,支持空格和撇號。
下載量 116
發布時間 : 7/31/2022

模型概述

本模型用於將語音轉錄為包含空格和撇號的小寫拉丁字母,在約2000小時的盧旺達語語音數據上進行訓練。

模型特點

高準確度轉錄
可將語音準確轉錄為小寫拉丁字母,支持空格和撇號。
大型模型架構
基於Conformer的非自迴歸'大型'變體,參數約1.2億,性能強大。
易用性
可在NeMo工具包中使用,方便進行推理和微調。

模型能力

語音識別
語音轉錄
支持盧旺達語

使用案例

語音轉錄
音頻文件轉錄
將盧旺達語語音文件轉錄為文本
準確率較高,測試集WER為16.19%
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase