W

Wavlm Bart

由nguyenvulebinh開發
一個支持英語自動語音識別(ASR)的序列到序列模型,能夠輸出規範化文本、標註時間戳以及多說話人分段。
下載量 24
發布時間 : 5/23/2023

模型概述

該模型基於wav2vec2和bartpho架構,主要用於英語語音識別任務,支持輸出帶有時間戳的文本和多說話人分段。

模型特點

時間戳標註
能夠為識別的文本標註精確的時間戳
多說話人分段
支持識別和分段不同說話人的語音
規範化文本輸出
輸出經過規範化的文本結果

模型能力

英語語音識別
時間戳標註
多說話人分段

使用案例

語音轉錄
會議記錄
將會議錄音轉換為帶時間戳的文本記錄
準確識別發言內容並標註發言時間點
訪談轉錄
轉錄訪談錄音並區分不同說話人
自動分段不同訪談對象的發言
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase