S

Stt Es Conformer Transducer Large

nvidiaによって開発
これはスペイン語自動音声認識用の大型Conformer-トランスデューサーモデルで、約1.2億パラメータを持ち、1340時間のスペイン語音声データでトレーニングされています。
ダウンロード数 708
リリース時間 : 7/8/2022

モデル概要

このモデルはスペースを含む小文字のスペイン語アルファベットの音声を転写するために使用され、Conformer-トランスデューサーアーキテクチャに基づいており、高い精度とストリーミング処理能力を備えています。

モデル特徴

高精度スペイン語認識
Common Voice 7.0テストセットでWER5.2%など、複数のテストセットで優れた性能を発揮
大規模トレーニングデータ
1340時間のスペイン語音声を含む複合データセットでトレーニング
ストリーミング処理能力
トランスデューサーアーキテクチャに基づき、ストリーミング音声認識をサポート

モデル能力

スペイン語音声認識
音声転写
ストリーミング音声処理

使用事例

音声からテキストへ
音声転写サービス
スペイン語音声コンテンツをテキストに変換
高精度な転写結果
音声アシスタント
スペイン語音声インタラクション
スペイン語音声アシスタントの開発に使用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase