F

Fsmn Vad

由funasr開發
FunASR是一個致力於連接語音識別學術研究與工業應用的基礎工具包,支持語音識別、語音活動檢測、標點恢復等多種功能。
下載量 107
發布時間 : 2/1/2024

模型概述

FunASR提供全棧語音處理功能,包括語音識別(ASR)、語音活動檢測(VAD)、標點恢復、語言模型等,支持預訓練模型的推理與微調。

模型特點

工業級模型支持
提供經過工業數據訓練的預訓練模型,可直接用於生產環境
全棧語音處理
整合ASR、VAD、標點恢復、說話人驗證等完整語音處理流程
高效推理
Paraformer模型兼具高精度與高效率,適合即時應用場景

模型能力

語音識別
語音活動檢測
標點恢復
說話人驗證
多說話人識別
時間戳預測

使用案例

語音轉寫
會議記錄自動生成
將會議錄音自動轉寫為帶標點和說話人信息的文本
準確率可達90%以上(依賴音頻質量)
即時語音處理
即時字幕生成
為直播或視頻會議提供即時字幕
延遲可控制在600ms以內
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase