S

Sew D Tiny 100k Ft Ls100h

由asapp開發
SEW-D-tiny 是由 ASAPP Research 開發的高效語音識別預訓練模型,專注於性能和效率的平衡。
下載量 24.55k
發布時間 : 3/2/2022

模型概述

該模型在16kHz採樣的語音音頻上進行了預訓練,適用於自動語音識別、說話人識別、意圖分類等下游任務。

模型特點

高效推理
相比wav2vec 2.0實現了1.9倍的推理加速。
性能提升
在LibriSpeech的100h-960h半監督設置下,詞錯誤率相對降低了13.5%。
輕量級
模型設計注重效率,適合資源受限的環境。

模型能力

語音識別
說話人識別
意圖分類
情感識別

使用案例

語音轉文本
LibriSpeech 語音轉錄
將LibriSpeech數據集中的語音轉換為文本。
在LibriSpeech clean測試集上WER為10.47,other測試集上WER為22.73。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase