I

Indicconformer Stt Kn Hybrid Ctc Rnnt Large

ai4bharatによって開発
IndicConformerは、混合CTC-RNNTアーキテクチャに基づくConformer自動音声認識(ASR)モデルで、カンナダ語音声認識に特化しています。
ダウンロード数 130
リリース時間 : 9/5/2024

モデル概要

このモデルはConformer-Largeアーキテクチャで、1.2億のパラメータを含み、混合CTC-RNNTデコーダを使用してカンナダ語音声をテキストに変換できます。

モデル特徴

混合CTC-RNNTデコーダ
CTCとRNNTデコーダの利点を組み合わせ、音声認識の精度と堅牢性を向上させます。
高性能Conformerアーキテクチャ
Conformer-Largeアーキテクチャを採用し、17のConformerモジュールを含み、モデル次元は512で、音声信号を効率的に処理できます。
カンナダ語サポート
カンナダ語に特化して最適化されており、カンナダ語音声を正確に認識できます。

モデル能力

音声認識
カンナダ語音声からテキストへの変換

使用事例

音声からテキストへの変換
カンナダ語音声の文字起こし
カンナダ語音声をテキストに変換し、音声アシスタントや字幕生成などのシナリオに適用できます。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase