W

Whisper Large V3 French Distil Dec16

由bofenghuang開發
Whisper-Large-V3-法語蒸餾版是通過將解碼器層數從32層縮減至16層,並基於大規模數據集進行蒸餾訓練而得到的法語語音識別模型。該模型在保持性能的同時顯著降低了內存佔用和推理時間。
下載量 2,461
發布時間 : 12/13/2023

模型概述

這是一個針對法語優化的語音識別模型,通過蒸餾技術減少了模型複雜度,適合需要高效語音轉錄的應用場景。

模型特點

高效蒸餾架構
解碼器層數從32層縮減至16層,顯著降低計算資源需求
性能保持
在保持接近原始模型準確率的同時提升推理速度
長文本處理優化
有效緩解了長文本轉錄中的幻覺風險
多框架支持
支持transformers、openai-whisper、fasterwhisper等多種推理框架

模型能力

法語語音識別
長音頻轉錄
即時語音轉文字

使用案例

客服場景
客服通話記錄轉錄
將法語客服通話內容自動轉錄為文字
在包含背景噪聲和領域術語的測試集上表現良好
媒體處理
法語視頻字幕生成
自動為法語視頻內容生成字幕
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase