W

Wav2vec2 From Scratch Finetune Dummy

由inergi開發
這是一個基於XLSR Wav2Vec2架構的印度尼西亞語自動語音識別模型,由cahya開發並在通用語音印度尼西亞語數據集上微調。
下載量 15
發布時間 : 3/2/2022

模型概述

該模型專門用於印度尼西亞語的自動語音識別任務,能夠將印度尼西亞語語音轉換為文本。

模型特點

XLSR微調
基於XLSR Wav2Vec2架構進行微調,優化了印度尼西亞語的識別性能
低詞錯誤率
在通用語音印度尼西亞語測試集上達到25.86%的詞錯誤率(WER)
多語言基礎
基於跨語言語音表示學習(XLSR)的預訓練模型,具有良好的語音特徵提取能力

模型能力

印度尼西亞語語音識別
語音轉文本

使用案例

語音轉錄
會議記錄
將印度尼西亞語的會議錄音自動轉錄為文字記錄
準確率約74.14%(基於WER指標)
語音助手
為印度尼西亞語語音助手提供語音識別能力
教育
語言學習應用
幫助學習者練習印度尼西亞語發音和聽力
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase