P

Paraformer Large

funasrによって開発
Paraformer は革新的な非自己回帰エンドツーエンド音声認識モデルで、従来の自己回帰モデルと比べて顕著な利点があり、全文のターゲットテキストを並列生成でき、特にGPUを利用した並列推論に適しています。
ダウンロード数 43
リリース時間 : 4/17/2023

モデル概要

Paraformer は効率的な非自己回帰エンドツーエンド音声認識モデルで、産業級データにおいて自己回帰モデルと同等の性能を発揮しつつ、推論効率を大幅に向上させます。

モデル特徴

並列推論
全文のターゲットテキストを並列生成でき、特にGPUを利用した並列推論に適しており、推論効率を大幅に向上させます
効率的推論
従来の自己回帰モデルと比べて、音声認識クラウドサービスのマシンコストを約10分の1に削減できます
高性能
産業級データにおいて自己回帰モデルと同等の性能を発揮します
産業級アプリケーション
6万時間の標準中国語データセットでトレーニングされており、産業級アプリケーションシナリオに適しています

モデル能力

標準中国語音声認識
高精度テキスト変換
バッチ音声処理

使用事例

音声書き起こしサービス
クラウド音声認識サービス
クラウドサービスに効率的な音声認識能力を提供します
マシンコストを約10分の1に削減
インテリジェントカスタマーサービス
カスタマーサービス音声分析
カスタマーサービス通話内容をリアルタイムで書き起こします
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase