S

Stt Fr Conformer Ctc Large

由nvidia開發
這是一個基於Conformer架構的法語自動語音識別(ASR)大模型,採用CTC損失函數,在超過1500小時的法語語音數據上訓練而成。
下載量 361
發布時間 : 6/28/2022

模型概述

該模型用於法語語音識別任務,能夠將法語語音轉換為文本,支持16kHz單聲道音頻輸入。

模型特點

高性能識別
在多個測試集上表現出色,如MCV7.0測試集WER僅9.63%,MLS測試集WER僅4.91%
大規模訓練數據
在超過1500小時的法語語音數據上訓練,涵蓋多個領域
Riva兼容
支持通過NVIDIA Riva進行生產級服務器部署
非自迴歸架構
採用Conformer-CTC架構,實現高效推理

模型能力

法語語音識別
音頻轉錄
批量語音處理

使用案例

語音轉錄
法語語音轉文字
將法語語音內容轉換為文本
高準確率的轉錄結果
語音助手
法語語音交互
為法語語音助手提供語音識別能力
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase