wav2vec2-xls-r-300m-indonesian開源模型 - 精準實現印度尼西亞語自動語音識別

Wav2vec2 Xls R 300m Indonesian

由Wikidepia開發

基於Facebook的XLS-R-300M模型在印度尼西亞語語音數據上微調的自動語音識別模型

下載量 4,486

發布時間 : 3/2/2022

模型概述

該模型是針對印度尼西亞語優化的自動語音識別(ASR)模型，基於Facebook的wav2vec2-xls-r-300m架構，在Common Voice 8.0和MagicHub印度尼西亞語會話語音語料庫上微調。

高性能印度尼西亞語識別

在Common Voice 8測試集上達到5.046%的詞錯誤率(WER)和1.699%的字錯誤率(CER)

多數據集訓練

結合了Common Voice 8.0和MagicHub印度尼西亞語會話語音語料庫進行訓練

魯棒性評估

在魯棒語音賽事數據集上進行了性能評估，展示了在不同條件下的識別能力

印度尼西亞語語音識別

語音轉文本

自動語音轉錄

語音轉錄

語音助手

用於印度尼西亞語語音助人的語音識別組件

會議記錄

自動轉錄印度尼西亞語會議內容

無障礙技術

即時字幕生成

為印度尼西亞語視頻內容生成即時字幕

屬性	詳情
模型類型	自動語音識別模型
訓練數據	`mozilla - foundation/common_voice_8_0`和MagicHub印尼語對話語音語料庫

任務	數據集	指標	值
自動語音識別	Common Voice 8	測試詞錯誤率（Test WER）	5.046
自動語音識別	Common Voice 8	測試字符錯誤率（Test CER）	1.699
自動語音識別	Robust Speech Event - Dev Data	測試詞錯誤率（Test WER）	41.31
自動語音識別	Robust Speech Event - Test Data	測試詞錯誤率（Test WER）	52.23