S

Stt Es Conformer Ctc Large

nvidiaによって開発
これはNVIDIAがトレーニングし公開した、スペイン語自動音声認識(ASR)用の大型Conformer-CTCモデルです。
ダウンロード数 59
リリース時間 : 7/8/2022

モデル概要

このモデルは、スペースを含む小文字のスペイン語アルファベットの音声を転写するために使用され、Conformerアーキテクチャに基づき、CTC損失/デコード方法を採用しています。

モデル特徴

高性能認識
Common Voice 7.0テストセットでWER5.5%など、複数のテストセットで優れた性能を発揮
大規模トレーニングデータ
1340時間のスペイン語音声データを使用してトレーニング
Rivaデプロイ互換
NVIDIA Rivaと連携可能で、プロダクションレベルのサーバー展開を実現
非自己回帰アーキテクチャ
Conformer-CTCの非自己回帰アーキテクチャを採用、約1.2億パラメータ

モデル能力

スペイン語音声認識
音声転写
16kHzモノラル音声入力対応

使用事例

音声からテキストへ
音声転写サービス
スペイン語音声コンテンツをテキストに変換
高精度な転写結果
音声アシスタント
スペイン語音声アシスタント
スペイン語音声アシスタントの開発に使用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase