W

Wav2vec2 Bartpho

由nguyenvulebinh開發
這是一個支持越南語的自動語音識別模型,能夠輸出規範化文本、標記時間戳以及多說話人分段。
下載量 472
發布時間 : 10/5/2023

模型概述

該模型基於wav2vec2和bartpho架構,專門用於越南語的自動語音識別任務,支持輸出帶時間戳的文本和多說話人分段。

模型特點

時間戳標記
能夠為識別的文本標記精確的時間戳
多說話人分段
支持識別和分段不同說話人的語音
文本規範化
輸出經過規範化的識別文本

模型能力

越南語語音識別
時間戳標記
多說話人分段
文本規範化輸出

使用案例

語音轉錄
新聞轉錄
將越南語新聞廣播轉錄為帶時間戳的文本
示例輸出中包含精確的時間標記和分段
會議記錄
多說話人會議記錄
自動識別會議中不同發言人的語音並分段
可區分不同說話人並標記發言時間
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase