S

Sew Tiny 100k Ft Ls100h

由asapp開發
SEW(壓縮高效版Wav2vec)是由ASAPP Research開發的語音識別預訓練模型,在性能和效率上優於wav2vec 2.0
下載量 736
發布時間 : 3/2/2022

模型概述

基於16kHz採樣語音音頻預訓練的語音識別模型,需在下游任務上微調使用

模型特點

高效性能
相比wav2vec 2.0實現1.9倍推理加速,詞錯誤率降低13.5%
壓縮架構
優化的模型架構在保持性能的同時減少計算資源需求
多任務適配
可通過微調應用於ASR、說話人識別、意圖分類等多種語音任務

模型能力

語音識別
語音轉文本
音頻特徵提取

使用案例

語音轉錄
LibriSpeech語音轉錄
將英文有聲讀物內容轉錄為文本
在LibriSpeech clean測試集上WER 10.61,other測試集上WER 23.74
語音應用開發
語音助手
作為語音助手的語音識別組件
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase