I

Indicconformer Stt Te Hybrid Ctc Rnnt Large

ai4bharatによって開発
IndicConformerは、混合CTC-RNNTアーキテクチャに基づくConformer自動音声認識(ASR)モデルで、テルグ語音声認識をサポートしています。
ダウンロード数 1,244
リリース時間 : 9/5/2024

モデル概要

このモデルはConformer-Largeアーキテクチャを採用し、テルグ語音声認識のために特別に設計されており、16KHzモノラル音声をテキストに変換できます。

モデル特徴

混合デコーダアーキテクチャ
CTCとRNNTの2つのデコーダを組み合わせ、より正確な音声認識結果を提供します
大規模モデル容量
1.2億パラメータのConformer-Largeアーキテクチャで、強力な音声認識能力を備えています
特定言語最適化
テルグ語に特化して最適化されたトレーニングを行っています

モデル能力

テルグ語音声認識
音声からテキストへの変換
混合デコーダ推論

使用事例

音声文字起こし
テルグ語音声からテキストへ
テルグ語の音声コンテンツをテキスト形式に変換します
高精度な文字起こしテキスト
音声アシスタント
テルグ語音声インタラクション
テルグ語音声アシスタントに音声認識機能を提供します
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase