I

Indicconformer Stt Gu Hybrid Ctc Rnnt Large

由ai4bharat開發
IndicConformer 是一個基於混合 CTC-RNNT 架構的 Conformer 自動語音識別(ASR)模型,專門用於古吉拉特語的語音轉錄。
下載量 340
發布時間 : 9/5/2024

模型概述

該模型採用 Conformer-Large 架構,能夠將16kHz單聲道音頻中的古吉拉特語語音轉錄為文本。

模型特點

混合解碼架構
同時支持CTC和RNNT兩種解碼方式,提供更靈活的推理選項
大模型容量
1.2億參數的編碼器結構,具備強大的語音特徵提取能力
專門優化
針對古吉拉特語進行專門訓練和優化

模型能力

古吉拉特語語音識別
16kHz音頻處理
單聲道音頻轉錄

使用案例

語音轉文字
古吉拉特語會議記錄
將古吉拉特語會議錄音自動轉錄為文字記錄
生成準確的會議文字記錄
語音助手
為古吉拉特語用戶提供語音輸入支持
實現古吉拉特語語音交互
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase