S

Stt Fr Fastconformer Hybrid Large Pc

由nvidia開發
這是一個法語自動語音識別模型,基於FastConformer架構,結合了Transducer和CTC解碼器,具有高準確率和多領域適應性。
下載量 1,331
發布時間 : 5/23/2023

模型概述

該模型能夠轉錄包含大小寫法語字母、空格、句號、逗號和問號的語音。是FastConformer Transducer-CTC模型的'大型'版本,約1.15億參數。

模型特點

混合訓練
結合Transducer和CTC兩種損失函數進行訓練,提高模型魯棒性
優化架構
採用FastConformer架構,具有8倍深度可分離卷積下采樣,效率更高
多數據集訓練
在1800小時法語語音數據上訓練,包括MCV12、MLS和Voxpopuli數據集
標點支持
支持轉錄包含句號、逗號和問號的文本

模型能力

法語語音識別
標點符號識別
大小寫識別
長音頻處理

使用案例

語音轉錄
會議記錄
將法語會議錄音轉換為文字記錄
WER 7.92 (MCV12測試集)
音頻字幕
為法語視頻內容生成字幕
WER 5.21 (MLS測試集)
語音分析
語音數據分析
分析法語語音數據中的關鍵詞和內容
WER 6.49 (VoxPopuli測試集)
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase