I

Indicconformer Stt Sa Hybrid Ctc Rnnt Large

由ai4bharat開發
基於Conformer-Large架構的混合CTC-RNNT語音識別模型,專為梵語設計
下載量 25
發布時間 : 9/5/2024

模型概述

IndicConformer是一個高性能自動語音識別(ASR)模型,採用混合CTC-RNNT解碼架構,支持梵語語音轉文本任務。

模型特點

混合解碼架構
同時支持CTC和RNNT兩種解碼方式,提供更靈活的推理選擇
大容量模型
採用Conformer-Large架構,包含1.2億參數,具備強大的語音特徵提取能力
專業語言支持
專門針對梵語優化的語音識別模型

模型能力

梵語語音識別
音頻轉文本
支持16kHz單聲道音頻處理

使用案例

學術研究
梵語文獻數字化
將梵語語音記錄轉換為可搜索的文本格式
文化保護
梵語口述傳統保存
轉錄梵語口頭傳統和宗教經文
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase