I

Indicconformer Stt Sa Hybrid Ctc Rnnt Large

ai4bharatによって開発
Conformer-Largeアーキテクチャに基づく混合CTC-RNNT音声認識モデル、サンスクリット専用設計
ダウンロード数 25
リリース時間 : 9/5/2024

モデル概要

IndicConformerは高性能な自動音声認識(ASR)モデルで、混合CTC-RNNTデコーディングアーキテクチャを採用し、サンスクリット音声からテキストへの変換タスクをサポートします。

モデル特徴

混合デコーディングアーキテクチャ
CTCとRNNTの2つのデコーディング方式を同時にサポートし、より柔軟な推論選択を提供
大容量モデル
Conformer-Largeアーキテクチャを採用し、1.2億パラメータを含み、強力な音声特徴抽出能力を備える
専門言語サポート
サンスクリットに特化して最適化された音声認識モデル

モデル能力

サンスクリット音声認識
音声からテキストへの変換
16kHzモノラル音声処理をサポート

使用事例

学術研究
サンスクリット文献のデジタル化
サンスクリット音声記録を検索可能なテキスト形式に変換
文化保護
サンスクリット口承伝統の保存
サンスクリットの口承伝統や宗教経典を転写
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase