F

Faster Distil Whisper Large V2

由Systran開發
這是一個基於Whisper架構的蒸餾版本自動語音識別(ASR)模型,專為高效推理設計,適用於英語語音轉文本任務。
下載量 1,336
發布時間 : 1/19/2024

模型概述

該模型是Whisper大型v2模型的蒸餾版本,保留了原始模型的高準確性同時顯著提升了推理速度,適用於需要即時語音識別的應用場景。

模型特點

高效推理
通過知識蒸餾技術優化,相比原始Whisper模型顯著提升了推理速度
高準確率
保留了原始Whisper大型v2模型的識別準確率
CTranslate2兼容
已轉換為CTranslate2格式,可與faster-whisper等高效推理庫配合使用
FP16量化
模型權重以FP16格式保存,平衡了精度和性能需求

模型能力

英語語音識別
長音頻轉錄
即時語音轉文本

使用案例

語音轉錄
會議記錄自動化
自動將英語會議錄音轉換為文字記錄
高效生成可搜索的會議文本記錄
播客轉錄
將英語播客內容自動轉換為文字稿
快速生成可供編輯和發佈的文字內容
輔助技術
即時字幕生成
為英語視頻或直播提供即時字幕
提升內容可訪問性
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase