S

Stt Zh Conformer Transducer Large

Developed by nvidia
これは標準中国語音声を転写するための大規模なConformer-Transducerモデルで、約1.2億のパラメータを持ち、AISHELL-2データセットでトレーニングされました。
Downloads 72
Release Time : 6/29/2022

Model Overview

このモデルはConformer-Transducerアーキテクチャに基づく自動音声認識モデルで、標準中国語音声転写タスク専用に設計されています。

Model Features

高性能転写
AISHELL-2テストセットで5.3-5.7%の文字誤り率(CER)を達成
大規模トレーニング
約1.2億パラメータの大規模モデルアーキテクチャを使用し、より正確な転写結果を提供
標準中国語最適化
標準中国語音声に特化してトレーニングと最適化を実施

Model Capabilities

標準中国語音声認識
音声転写
音声テキスト変換

Use Cases

音声転写
会議議事録
標準中国語の会議録音を自動的に文字記録に転写
約94.3-94.7%の精度
音声アシスタント
標準中国語音声アシスタントに音声認識機能を提供
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase