F

Fsmn Vad

funasrによって開発
FunASRは音声認識の学術研究と産業応用を結びつける基本ツールキットで、音声認識、音声活動検出、句読点回復など多機能をサポートします。
ダウンロード数 107
リリース時間 : 2/1/2024

モデル概要

FunASRは音声認識(ASR)、音声活動検出(VAD)、句読点回復、言語モデルなどフルスタック音声処理機能を提供し、事前学習モデルの推論と微調整をサポートします。

モデル特徴

産業用モデルサポート
産業データで訓練された事前学習モデルを提供し、直接生産環境で使用可能
フルスタック音声処理
ASR、VAD、句読点回復、話者認証など完全な音声処理プロセスを統合
高効率推論
Paraformerモデルは高精度と高効率を兼ね備え、リアルタイムアプリケーションに適しています

モデル能力

音声認識
音声活動検出
句読点回復
話者認証
複数話者認識
タイムスタンプ予測

使用事例

音声文字起こし
会議議録自動生成
会議録音を自動的に句読点と話者情報付きのテキストに変換
音声品質に依存し90%以上の精度を達成可能
リアルタイム音声処理
リアルタイム字幕生成
ライブ配信やビデオ会議にリアルタイム字幕を提供
遅延を600ms以内に制御可能
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase