F

Faster Whisper Medium

由Systran開發
這是OpenAI Whisper中等模型的CTranslate2轉換版本,用於高效語音識別任務。
下載量 155.87k
發布時間 : 11/23/2023

模型概述

該模型是OpenAI Whisper中等模型的CTranslate2格式轉換版本,專注於自動語音識別(ASR),支持多種語言,適用於需要高效語音轉文本的應用場景。

模型特點

高效推理
通過CTranslate2轉換,提供比原始PyTorch模型更快的推理速度
多語言支持
支持超過100種語言的語音識別
FP16量化
模型權重以FP16格式保存,平衡精度和性能
易於集成
可與faster-whisper等基於CTranslate2的項目無縫集成

模型能力

語音轉文本
多語言識別
即時轉錄
音頻文件處理

使用案例

媒體轉錄
播客轉錄
將播客音頻內容自動轉換為文字稿
高效準確的多語言轉錄
視頻字幕生成
為視頻內容自動生成字幕
支持多種語言的字幕創建
會議記錄
會議即時轉錄
在會議過程中即時生成文字記錄
提高會議可訪問性和記錄效率
語音助手
語音命令識別
為智能設備提供語音交互能力
支持多語言的語音控制
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase