W

Whisper Large V3 Distil It V0.2

由bofenghuang開發
專為意大利語優化的2層解碼器蒸餾版Whisper語音轉文本模型,提升效率同時保持準確性
下載量 129
發布時間 : 8/22/2024

模型概述

基於OpenAI Whisper-Large-V3的意大利語優化版本,採用2層解碼器蒸餾技術,在保持語音識別準確性的同時顯著提升推理速度。支持多種推理框架,適合即時語音轉文本應用。

模型特點

高效蒸餾架構
僅保留2層解碼器,參數量減少51%,推理速度提升5.8倍
長文本優化
擴展30秒音頻片段訓練,保持長文本轉錄能力
多框架兼容
支持transformers、openai-whisper、faster-whisper等多種推理框架
推測解碼支持
可作為草稿模型與完整Whisper配合使用,實現2倍加速且輸出一致

模型能力

意大利語語音識別
長音頻轉錄
即時語音轉文本
多框架部署

使用案例

語音轉錄
會議記錄自動化
將意大利語會議錄音自動轉為文字記錄
詞錯誤率(WER)優於同類蒸餾模型
媒體字幕生成
為意大利語視頻內容生成準確字幕
支持長達30秒的音頻片段處理
即時應用
即時語音翻譯前端
作為語音識別模塊集成到即時翻譯系統
5.8倍速度提升適合即時場景
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase