W

Wav2vec2 Luganda

由indonesian-nlp開發
基於Facebook的wav2vec2-large-xlsr-53模型微調而成的盧幹達語自動語音識別系統,在Common Voice盧幹達語數據集上取得7.53%的WER。
下載量 52
發布時間 : 3/2/2022

模型概述

專為盧幹達語設計的自動語音識別模型,適用於將盧幹達語語音轉換為文本。

模型特點

高準確率
在Common Voice盧幹達語測試集上達到7.53%的詞錯誤率(WER)
基於強大基礎模型
基於Facebook的wav2vec2-large-xlsr-53模型微調,繼承了其優秀的語音特徵提取能力
支持KenLM語言模型
可結合KenLM語言模型進一步提升識別準確率

模型能力

盧幹達語語音識別
16kHz音頻處理
批量語音轉文本

使用案例

語音轉寫
盧幹達語語音轉錄
將盧幹達語語音內容轉換為文本
7.53%的詞錯誤率
語音助手
盧幹達語語音交互
為盧幹達語語音助手提供語音識別能力
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase