S

Stt Fa Fastconformer Hybrid Large

nvidiaによって開発
これはペルシャ語の自動音声認識(ASR)向けのハイブリッドモデルで、センサーとCTCデコーダーの損失を組み合わせ、FastConformerアーキテクチャに基づいて最適化されています。
ダウンロード数 2,398
リリース時間 : 11/21/2023

モデル概要

このモデルはペルシャ語の音声をテキストに転写するために使用され、FastConformerセンサー-CTCモデルの'大規模'バージョンで、1億1500万のパラメータを持ちます。

モデル特徴

ハイブリッドトレーニング
センサーとCTCデコーダーの損失を同時に使用してトレーニングし、モデルの堅牢性を向上
最適化アーキテクチャ
FastConformerアーキテクチャに基づき、8倍の深さ分離可能な畳み込みダウンサンプリングを実装
高精度
ペルシャ語テストセットで13.16% WERと3.85% CERの優れた性能を達成

モデル能力

ペルシャ語音声認識
音声転写
リアルタイム音声処理

使用事例

音声からテキストへ
ペルシャ語音声転写
ペルシャ語音声をテキストに変換
CommonVoiceテストセットで13.16% WERを達成
音声アシスタント
ペルシャ語音声コマンド認識
ペルシャ語音声アシスタントの開発に使用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase