S

Stt Zh Conformer Transducer Large

nvidiaによって開発
これは標準中国語音声を転写するための大規模なConformer-Transducerモデルで、約1.2億のパラメータを持ち、AISHELL-2データセットでトレーニングされました。
ダウンロード数 72
リリース時間 : 6/29/2022

モデル概要

このモデルはConformer-Transducerアーキテクチャに基づく自動音声認識モデルで、標準中国語音声転写タスク専用に設計されています。

モデル特徴

高性能転写
AISHELL-2テストセットで5.3-5.7%の文字誤り率(CER)を達成
大規模トレーニング
約1.2億パラメータの大規模モデルアーキテクチャを使用し、より正確な転写結果を提供
標準中国語最適化
標準中国語音声に特化してトレーニングと最適化を実施

モデル能力

標準中国語音声認識
音声転写
音声テキスト変換

使用事例

音声転写
会議議事録
標準中国語の会議録音を自動的に文字記録に転写
約94.3-94.7%の精度
音声アシスタント
標準中国語音声アシスタントに音声認識機能を提供
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase