S

Sew D Mid 400k Librispeech Clean 100h Ft

由patrickvonplaten開發
該模型是基於asapp/sew-d-mid-400k在LIBRISPEECH_ASR - CLEAN數據集上微調得到的自動語音識別模型,在評估集上取得了1.0536的詞錯誤率(WER)。
下載量 15
發布時間 : 3/2/2022

模型概述

一個針對英語語音識別任務優化的模型,特別適用於LibriSpeech數據集中的乾淨語音樣本。

模型特點

高效語音識別
基於SEW-D架構優化,提供高效的語音轉文本能力
低詞錯誤率
在LibriSpeech clean 100h數據集上達到1.0536的WER
多GPU訓練優化
支持分佈式訓練,優化了多GPU環境下的性能

模型能力

英語語音識別
高精度轉錄
處理乾淨語音樣本

使用案例

語音轉錄
有聲書轉錄
將高質量的有聲讀物內容轉換為文本
高準確率的轉錄結果
會議記錄
在安靜環境下進行會議語音記錄
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase