S

Stt Uk Citrinet 1024 Gamma 0 25

nvidiaによって開発
これはウクライナ語の自動音声認識(ASR)用のストリーミングCitrinetモデルで、1億4100万のパラメータを持ち、69時間のウクライナ語音声データでトレーニングされ、テストWERは3.52%という低さです。
ダウンロード数 65
リリース時間 : 7/27/2022

モデル概要

このモデルはストリーミングCitrinetの非自己回帰バリアントで、CTC損失/デコードを使用し、スペースやアポストロフィを含むウクライナ語小文字の音声を転写できます。

モデル特徴

言語間転移学習
このモデルは事前トレーニング済みのロシア語Citrinet-1024モデルから言語間転移学習手法でファインチューニングされました
高性能
複数バージョンのMozilla Common Voiceテストセットで優れたWER性能を発揮し、最低3.52%を達成
ストリーミング処理
ストリーミング音声認識をサポートし、リアルタイムアプリケーションに適しています
Riva互換
NVIDIA Rivaと互換性があり、本番サーバー展開に使用可能

モデル能力

ウクライナ語音声認識
リアルタイム音声転写
音声ファイルバッチ処理

使用事例

音声転写
音声テキスト変換サービス
ウクライナ語音声コンテンツをテキストに変換
高精度転写、WERは3.52%という低さ
リアルタイムアプリケーション
リアルタイム字幕生成
ウクライナ語動画やライブ配信のためのリアルタイム字幕生成
ストリーミング処理能力が低遅延アプリケーションをサポート
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase