W

Whisper Large V3 Distil Fr V0.2

由bofenghuang開發
專為法語語音轉文本優化的Whisper蒸餾版本,僅保留2層解碼器結構,在保證準確率的同時提升推理效率
下載量 385
發布時間 : 8/22/2024

模型概述

基於OpenAI Whisper-large-v3的法語優化蒸餾模型,通過減少解碼器層數和採用耐心教師蒸餾策略,實現高效語音識別

模型特點

高效推理
相比原模型提速5.8倍,參數量僅需49%,適合資源受限場景
長文本優化
訓練採用30秒音頻片段,增強長文本轉錄能力,減少幻覺輸出
多框架兼容
支持transformers、faster-whisper、whisper.cpp等多種推理框架
推測解碼支持
可作為草稿模型實現2倍加速,且保證輸出與原模型一致

模型能力

法語語音轉文本
長音頻轉錄
即時語音識別
帶噪語音處理

使用案例

客服場景
客服通話轉錄
處理含背景噪聲和領域術語的客服錄音
在內部測試集上表現良好
多媒體處理
法語視頻字幕生成
為法語視頻內容自動生成字幕
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase