X

XLSR WithLM Malayalam

由kavyamanohar開發
該模型是基於facebook/wav2vec2-xls-r-300m在IMaSC、Indic TTS Malayalam和OpenSLR Malayalam訓練集數據集上微調得到的版本,支持馬拉雅拉姆語自動語音識別。
下載量 19
發布時間 : 7/22/2024

模型概述

這是一個針對馬拉雅拉姆語優化的自動語音識別模型,使用KENLM庫訓練的三元語言模型進行增強,在多個馬拉雅拉姆語數據集上表現出色。

模型特點

多數據集微調
在IMaSC、Indic TTS Malayalam和OpenSLR Malayalam等多個馬拉雅拉姆語數據集上進行微調,提高了識別準確性。
語言模型增強
使用KENLM庫在ml-sentences數據集上訓練的三元語言模型進行後處理,顯著提升了識別效果。
高效訓練
採用梯度累積和混合精度訓練等技術,在有限資源下實現了高效訓練。

模型能力

馬拉雅拉姆語語音識別
語音轉文本

使用案例

語音轉錄
馬拉雅拉姆語語音轉錄
將馬拉雅拉姆語語音內容轉換為文本
在OpenSLR Malayalam測試集上WER為27.3
語音助手
馬拉雅拉姆語語音助手
用於構建支持馬拉雅拉姆語的語音助手應用
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase