W

Whisper Medicalv1

由Crystalcareai開發
Distil-Whisper是Whisper large-v3的知識蒸餾版本,專注於英語語音識別,提供更快的推理速度同時保持接近原始模型的準確性。
下載量 348
發布時間 : 4/28/2024

模型概述

這是一個針對英語語音識別優化的蒸餾模型,基於OpenAI的Whisper large-v3,通過大規模偽標籤知識蒸餾技術訓練,特別優化了長格式音頻轉錄的準確性。

模型特點

高效推理
比原始Whisper large-v3快6.3倍,比前代distil-large-v2快1.1倍
優化的長格式轉錄
專門調整以在使用順序長格式算法時提供更優的長格式轉錄準確性
兼容主流庫
設計為與Whisper cpp、Faster-Whisper和OpenAI Whisper等流行庫兼容
知識蒸餾
通過大規模偽標籤知識蒸餾技術訓練,保持接近原始模型的性能

模型能力

英語語音識別
短格式音頻轉錄(<30秒)
長格式音頻轉錄(>30秒)
支持順序和分塊兩種長格式轉錄算法
提供分段級時間戳

使用案例

語音轉錄
會議記錄轉錄
將會議錄音轉換為文字記錄
準確率高,特別適合長格式會議錄音
播客轉錄
將播客音頻內容轉換為文字
快速處理長音頻,保持高準確性
媒體處理
視頻字幕生成
為視頻內容自動生成字幕
高效處理長視頻內容
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase