S

Stt Uz Fastconformer Hybrid Large Pc

nvidiaによって開発
これはFastConformerアーキテクチャに基づく大型ウズベク語音声認識モデルで、TransducerとCTCの二重デコードをサポートし、複数のテストセットで優れた性能を発揮します。
ダウンロード数 96
リリース時間 : 10/31/2024

モデル概要

このモデルはウズベク語音声認識に使用され、大文字小文字、スペース、一般的な句読点を含むテキストへの転写が可能で、汎用音声認識シナリオに適しています。

モデル特徴

二重デコード機構
TransducerとCTCの2つのデコード方式を同時にサポートし、より柔軟な推論オプションを提供します
効率的なアーキテクチャ
最適化されたFastConformerアーキテクチャを採用し、標準Conformerと比較してより高い計算効率を実現
複数データセットトレーニング
1000時間のウズベク語音声データに基づいてトレーニングされ、様々な音声シナリオをカバー

モデル能力

ウズベク語音声認識
音声からテキストへの変換
バッチ音声処理

使用事例

音声転写
会議議事録
ウズベク語の会議録音を自動的に文字記録に転写
一般的なシナリオでWER約16-17%
音声アシスタント
ウズベク語音声アシスタントに音声認識機能を提供
教育
言語学習
ウズベク語学習者の発音精度チェックを支援
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase