I

Indicconformer Stt Gu Hybrid Ctc Rnnt Large

ai4bharatによって開発
IndicConformerは、混合CTC-RNNTアーキテクチャに基づくConformer自動音声認識(ASR)モデルで、グジャラート語の音声転写に特化しています。
ダウンロード数 340
リリース時間 : 9/5/2024

モデル概要

このモデルはConformer-Largeアーキテクチャを採用し、16kHzモノラルオーディオのグジャラート語音声をテキストに転写できます。

モデル特徴

混合デコードアーキテクチャ
CTCとRNNTの2つのデコード方式を同時にサポートし、より柔軟な推論オプションを提供
大規模モデル容量
1.2億パラメータのエンコーダー構造で、強力な音声特徴抽出能力を備える
特化最適化
グジャラート語向けに特別に訓練と最適化を実施

モデル能力

グジャラート語音声認識
16kHzオーディオ処理
モノラルオーディオ転写

使用事例

音声からテキストへ
グジャラート語会議議事録
グジャラート語会議録音を自動的にテキスト議事録に転写
正確な会議議事録を生成
音声アシスタント
グジャラート語ユーザーに音声入力サポートを提供
グジャラート語音声インタラクションを実現
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase