S

Stt De Conformer Ctc Large

nvidiaによって開発
これはドイツ語自動音声認識のための大規模Conformer-CTCモデルで、NVIDIAが数千時間のドイツ語音声データでトレーニングおよび最適化しました。
ダウンロード数 132
リリース時間 : 6/28/2022

モデル概要

このモデルはドイツ語音声を小文字テキスト(スペースを含む)に変換でき、Conformerアーキテクチャの非自己回帰バリアントを採用し、約1.2億のパラメータを持ちます。

モデル特徴

大規模トレーニングデータ
VoxPopuli、多言語LibriSpeech、Mozilla Common Voiceデータセットを含む数千時間のドイツ語音声データでトレーニングされました。
高性能
Common Voice 7テストセットでWER 6.68%など、複数のテストセットで優れた性能を発揮します。
Riva互換
NVIDIA Rivaと互換性があり、プロダクションレベルのサーバー展開に使用できます。
非自己回帰アーキテクチャ
Conformerの非自己回帰バリアントを採用し、CTC損失/デコードを使用するため、効率的な音声認識に適しています。

モデル能力

ドイツ語音声認識
音声文字起こし
16kHzモノラル音声入力に対応

使用事例

音声文字起こし
会議議事録
ドイツ語会議録音を自動的に文字起こし
高精度な文字起こしテキスト
音声アシスタント
ドイツ語音声アシスタントに音声認識機能を提供
リアルタイムで正確な音声から文字への変換
メディア処理
字幕生成
ドイツ語動画コンテンツに自動的に字幕を生成
効率的で正確な同期字幕
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase