faster-distil-whisper-large-v2開源語音識別模型 - 免費部署快速將英語語音轉文本

首頁

Faster Distil Whisper Large V2

由Systran開發

這是一個基於Whisper架構的蒸餾版本自動語音識別(ASR)模型，專為高效推理設計，適用於英語語音轉文本任務。

語音識別英語開源協議:MIT #高效語音識別 #多語言支持 #低延遲推理

下載量 1,336

發布時間 : 1/19/2024

模型概述

該模型是Whisper大型v2模型的蒸餾版本，保留了原始模型的高準確性同時顯著提升了推理速度，適用於需要即時語音識別的應用場景。

模型特點

高效推理

通過知識蒸餾技術優化，相比原始Whisper模型顯著提升了推理速度

高準確率

保留了原始Whisper大型v2模型的識別準確率

CTranslate2兼容

已轉換為CTranslate2格式，可與faster-whisper等高效推理庫配合使用

FP16量化

模型權重以FP16格式保存，平衡了精度和性能需求

模型能力

英語語音識別

長音頻轉錄

即時語音轉文本

使用案例

語音轉錄

會議記錄自動化

自動將英語會議錄音轉換為文字記錄

高效生成可搜索的會議文本記錄

播客轉錄

將英語播客內容自動轉換為文字稿

快速生成可供編輯和發佈的文字內容

輔助技術

即時字幕生成

為英語視頻或直播提供即時字幕

提升內容可訪問性

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Faster Distil Whisper Large V2

模型概述

模型特點

模型能力

使用案例

🚀 CTranslate2的Whisper distil-large-v2模型

🚀 快速開始

✨ 主要特性

💻 使用示例

基礎用法

🔧 技術細節

轉換詳情

📚 詳細文檔

📄 許可證