W

Wav2vec2 Xls R 300m Indonesian

由Wikidepia開發
基於Facebook的XLS-R-300M模型在印度尼西亞語語音數據上微調的自動語音識別模型
下載量 4,486
發布時間 : 3/2/2022

模型概述

該模型是針對印度尼西亞語優化的自動語音識別(ASR)模型,基於Facebook的wav2vec2-xls-r-300m架構,在Common Voice 8.0和MagicHub印度尼西亞語會話語音語料庫上微調。

模型特點

高性能印度尼西亞語識別
在Common Voice 8測試集上達到5.046%的詞錯誤率(WER)和1.699%的字錯誤率(CER)
多數據集訓練
結合了Common Voice 8.0和MagicHub印度尼西亞語會話語音語料庫進行訓練
魯棒性評估
在魯棒語音賽事數據集上進行了性能評估,展示了在不同條件下的識別能力

模型能力

印度尼西亞語語音識別
語音轉文本
自動語音轉錄

使用案例

語音轉錄
語音助手
用於印度尼西亞語語音助人的語音識別組件
會議記錄
自動轉錄印度尼西亞語會議內容
無障礙技術
即時字幕生成
為印度尼西亞語視頻內容生成即時字幕
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase