S

Stt Fr Fastconformer Hybrid Large Pc

Developed by nvidia
這是一個法語自動語音識別模型,基於FastConformer架構,結合了Transducer和CTC解碼器,具有高準確率和多領域適應性。
Downloads 1,331
Release Time : 5/23/2023

Model Overview

該模型能夠轉錄包含大小寫法語字母、空格、句號、逗號和問號的語音。是FastConformer Transducer-CTC模型的'大型'版本,約1.15億參數。

Model Features

混合訓練
結合Transducer和CTC兩種損失函數進行訓練,提高模型魯棒性
優化架構
採用FastConformer架構,具有8倍深度可分離卷積下采樣,效率更高
多數據集訓練
在1800小時法語語音數據上訓練,包括MCV12、MLS和Voxpopuli數據集
標點支持
支持轉錄包含句號、逗號和問號的文本

Model Capabilities

法語語音識別
標點符號識別
大小寫識別
長音頻處理

Use Cases

語音轉錄
會議記錄
將法語會議錄音轉換為文字記錄
WER 7.92 (MCV12測試集)
音頻字幕
為法語視頻內容生成字幕
WER 5.21 (MLS測試集)
語音分析
語音數據分析
分析法語語音數據中的關鍵詞和內容
WER 6.49 (VoxPopuli測試集)
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase