D

Distil Large V3

由distil-whisper開發
Distil-Whisper是Whisper large-v3的知識蒸餾版本,專注於英語自動語音識別,提供更快的推理速度同時保持接近原始模型的準確性。
下載量 417.11k
發布時間 : 3/21/2024

模型概述

這是Distil-Whisper英語系列的第三個版本,通過大規模偽標籤知識蒸餾技術開發,優化了長格式轉錄準確性,比前代版本在性能上有顯著提升。

模型特點

高效推理
比原始Whisper large-v3模型快6.3倍,比前代distil-large-v2快1.1倍
長格式轉錄優化
使用順序長格式算法提供更優的長格式轉錄準確性
兼容主流庫
設計為與Whisper cpp、Faster-Whisper、OpenAI Whisper等流行庫兼容

模型能力

英語語音識別
短格式音頻轉錄
長格式音頻轉錄
時間戳生成

使用案例

語音轉錄
會議記錄
將會議錄音轉換為文字記錄
準確率接近原始Whisper large-v3模型
播客轉錄
將長格式播客內容轉換為文字
使用順序算法時比distil-large-v2高出4.8%準確率
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase