I

Indicconformer Stt Ur Hybrid Ctc Rnnt Large

ai4bharatによって開発
IndicConformerは、混合CTC-RNNTアーキテクチャに基づくConformer自動音声認識モデルで、ウルドゥー語音声の書き起こしに特化しています。
ダウンロード数 44
リリース時間 : 9/5/2024

モデル概要

このモデルはConformer-Largeアーキテクチャを採用し、ウルドゥー語音声認識をサポートし、16kHzモノラルオーディオをテキストに変換できます。

モデル特徴

混合デコードアーキテクチャ
CTCとRNNTの2つのデコード方式を同時にサポートし、より柔軟な推論選択を提供します
大規模モデル容量
1.2億パラメータのConformer-Largeアーキテクチャにより、強力な音声認識能力を提供します
ウルドゥー語最適化
ウルドゥー語音声の特徴に特化して最適化されたモデル

モデル能力

ウルドゥー語音声認識
音声書き起こし
混合デコード(CTC/RNNT)

使用事例

音声書き起こし
ウルドゥー語音声からテキストへ
ウルドゥー語音声コンテンツをテキストに変換します
高精度な書き起こしテキスト
音声アシスタント
ウルドゥー語音声インタラクション
ウルドゥー語音声アシスタントに認識能力を提供します
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase