F

Faster Whisper Medium

由guillaumekln開發
本項目將openai/whisper-medium模型轉換為CTranslate2模型格式,可用於高效語音識別。
下載量 15.17k
發布時間 : 3/23/2023

模型概述

基於OpenAI Whisper-medium模型轉換的CTranslate2格式模型,支持多語言語音識別任務。

模型特點

高效推理
通過CTranslate2優化,提供比原始模型更快的推理速度
多語言支持
支持90多種語言的語音識別
量化支持
支持FP16量化,可通過compute_type選項調整數據類型

模型能力

語音轉文本
多語言識別
長音頻處理

使用案例

語音轉錄
會議記錄
將會議錄音自動轉錄為文字
準確率高,支持多語言會議
播客字幕生成
為播客內容自動生成字幕
支持多種語言播客內容
語音助手
語音命令識別
識別用戶語音命令
低延遲響應
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase