S

Stt Ru Fastconformer Hybrid Large Pc

nvidiaによって開発
これはロシア語自動音声認識のためのFastConformerハイブリッドモデルで、TransducerとCTCデコーダーを組み合わせ、パラメータ規模は約1.15億です。
ダウンロード数 6,513
リリース時間 : 5/26/2023

モデル概要

このモデルは大文字小文字のロシア語アルファベット、スペース、基本的な句読点を含む音声を転写でき、ロシア語音声認識タスクに適しています。

モデル特徴

ハイブリッドトレーニングアーキテクチャ
TransducerとCTCの2つの損失関数を同時に使用してトレーニングし、モデルの堅牢性を向上
最適化されたFastConformer
8倍の深さ分離可能な畳み込みダウンサンプリングを採用した最適化Conformerアーキテクチャで、処理効率を向上
マルチデータセットトレーニング
1840時間のロシア語音声を含む複合データセットでトレーニングし、様々な音声シナリオをカバー

モデル能力

ロシア語音声認識
句読点予測
大文字小文字認識

使用事例

音声転写
ロシア語音声からテキストへ
ロシア語音声コンテンツをテキスト形式に変換
Common Voice 12.0テストセットでWER5.3を達成
音声アシスタント
ロシア語音声コマンド認識
ロシア語音声コマンドを認識・理解
Golos crowdテストセットでWER1.9の低さ
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase