D

Distil Large V3 Ct2

由distil-whisper開發
Distil-Whisper是Whisper模型的蒸餾版本,針對長文本轉錄進行了優化,提供更快的推理速度和更高的詞錯誤率(WER)性能。
下載量 58
發布時間 : 3/21/2024

模型概述

此模型是轉換為CTranslate2格式的distil-large-v3權重,專為兼容OpenAI Whisper的長文本轉錄算法設計,相比前代版本平均提升5%的詞錯誤率(WER)。

模型特點

高效推理
通過CTranslate2引擎實現快速推理,適合即時語音識別應用
長文本優化
專門設計兼容OpenAI Whisper的長文本轉錄算法,處理長音頻效果更佳
性能提升
相比distil-large-v2版本,在4個分佈外數據集上平均提升5%的詞錯誤率(WER)

模型能力

英語語音識別
長音頻轉錄
即時語音轉文字

使用案例

語音轉錄
會議記錄
自動將會議錄音轉換為文字記錄
準確率高,支持長時間錄音
播客轉錄
將播客音頻內容轉換為可搜索的文字
處理長音頻效果優異
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase