S

Sew D Tiny 100k

由asapp開發
SEW-D是由ASAPP Research開發的壓縮高效型語音預訓練模型,基於16kHz採樣的語音音頻進行預訓練,適用於多種下游語音任務。
下載量 1,074
發布時間 : 3/2/2022

模型概述

SEW-D是一種高效的語音預訓練模型,專為自動語音識別等任務設計,通過優化架構實現性能與效率的雙重提升。

模型特點

高效推理
相比wav2vec 2.0實現了1.9倍的推理加速。
性能提升
在相近推理耗時下,詞錯誤率降低25%-50%。
優化架構
通過系統化分析架構設計,實現性能與效率的雙重提升。

模型能力

語音識別
說話人識別
意圖分類
情感識別

使用案例

語音處理
自動語音識別
將語音轉換為文本
在LibriSpeech數據集上詞錯誤率相對降低13.5%
說話人識別
識別不同說話人的身份
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase