D

Distil Wav2vec2

由OthmaneJ開發
Distil-wav2vec2是wav2vec2模型的蒸餾版本,體積縮小45%,推理速度提升兩倍,適用於自動語音識別任務。
下載量 854
發布時間 : 3/2/2022

模型概述

該模型是wav2vec2模型的輕量化版本,專注於自動語音識別任務,通過蒸餾技術實現了更小的模型體積和更快的推理速度。

模型特點

輕量化
模型體積比原版wav2vec2基礎模型縮小45%,更適合資源有限的環境。
高效推理
推理速度提升兩倍,CPU耗時0.4006秒,GPU耗時0.0046秒(批處理量為64時)。
性能平衡
在保持相對較低詞錯率的同時,顯著提升了運行效率。

模型能力

英語語音識別
音頻轉文本

使用案例

語音轉寫
會議記錄
將會議錄音自動轉寫為文本
詞錯率在Librispeech-test-clean上為0.0983
語音助手
用於輕量級語音助人的語音識別模塊
在資源受限設備上實現快速響應
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase