I

Indicconformer Stt Te Hybrid Ctc Rnnt Large

由ai4bharat開發
IndicConformer是一款基於混合CTC-RNNT架構的Conformer自動語音識別(ASR)模型,支持泰盧固語語音識別。
下載量 1,244
發布時間 : 9/5/2024

模型概述

該模型採用Conformer-Large架構,專為泰盧固語語音識別設計,能夠將16KHz單聲道音頻轉換為文本。

模型特點

混合解碼器架構
結合CTC和RNNT兩種解碼器,提供更準確的語音識別結果
大模型容量
1.2億參數的Conformer-Large架構,具有強大的語音識別能力
特定語言優化
專門針對泰盧固語進行優化訓練

模型能力

泰盧固語語音識別
音頻轉文本
混合解碼器推理

使用案例

語音轉錄
泰盧固語語音轉文字
將泰盧固語語音內容轉換為文本格式
高準確率的轉錄文本
語音助手
泰盧固語語音交互
為泰盧固語語音助手提供語音識別能力
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase