L

Lite Whisper Large V3 Fast

由efficient-speech開發
Lite-Whisper 是採用 LiteASR 技術壓縮的 OpenAI Whisper 輕量化版本,在保持較高識別準確率的同時顯著減小模型體積。
下載量 25
發布時間 : 2/26/2025

模型概述

基於 Whisper-large-v3 的輕量化自動語音識別模型,通過壓縮技術減少參數規模,適用於需要快速推理的場景。

模型特點

高效壓縮
採用 LiteASR 技術顯著減小模型體積,編碼器大小從 635M 壓縮至 308M
快速推理
專為需要快速語音識別的場景優化,在速度與準確率間取得平衡
接近原版性能
在 ESB 測試集上平均 WER 11.3,僅比原版 Whisper-large-v3 高 1.2%

模型能力

語音轉文本
多語言語音識別
即時語音處理

使用案例

語音轉錄
會議記錄自動化
將會議錄音即時轉換為文字記錄
準確率約 88.7%(WER 11.3)
媒體處理
視頻字幕生成
為視頻內容自動生成字幕
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase