S

Stt Be Fastconformer Hybrid Large Pc

nvidiaによって開発
これはFastConformerアーキテクチャに基づく大型のベラルーシ語自動音声認識モデルで、トランスフォーマーとCTCデコーダの損失を組み合わせ、1500時間のベラルーシ語音声データで訓練されています。
ダウンロード数 33
リリース時間 : 5/19/2023

モデル概要

このモデルは、大文字小文字のベラルーシ文字、空白、基本的な句読点を含む音声を文字起こしするために使用され、16kHzのモノラルオーディオ入力をサポートします。

モデル特徴

ハイブリッド訓練アーキテクチャ
トランスフォーマーとCTCデコーダの損失を同時に使用して訓練し、両方の方法の利点を組み合わせます。
効率的な処理
8倍の深度分離可能畳み込みダウンサンプリングを採用したFastConformerアーキテクチャで、処理速度を最適化します。
高い正確性
Common Voice 12.0ベラルーシ語テストセットで2.72%のWER(句読点を含まない)を達成します。

モデル能力

ベラルーシ語音声認識
オーディオ文字起こし
句読点予測

使用事例

音声文字起こし
音声を文字に変換
ベラルーシ語の音声内容をテキストに変換します。
正確率は97.28%(句読点を含まない)に達します。
音声アシスタント
音声コマンド認識
ベラルーシ語の音声アシスタントシステムでのコマンド認識に使用されます。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase