W

Wav2vec2 Large Xls R 300m Vietnamese Colab

由Jungwonchang開發
該模型是基於facebook/wav2vec2-xls-r-300m在通用語音數據集上微調的越南語語音識別模型
下載量 22
發布時間 : 3/17/2022

模型概述

這是一個針對越南語優化的語音識別模型,基於wav2vec2架構,適用於越南語語音轉文本任務

模型特點

越南語優化
針對越南語進行了專門微調,提高越南語語音識別準確率
基於XLS-R架構
採用Facebook的XLS-R大規模跨語言語音表示學習架構
中等規模
3億參數的平衡模型,兼顧性能和效率

模型能力

越南語語音識別
語音轉文本
自動語音轉錄

使用案例

語音轉錄
越南語會議記錄
將越南語會議錄音自動轉換為文字記錄
語音助手
為越南語語音助手提供語音識別能力
教育
語言學習應用
幫助學習者練習越南語發音和聽力
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase