W

Wav2vec2 Large Xlsr Malayalam

由gvs開發
基於facebook/wav2vec2-large-xlsr-53在馬拉雅拉姆語上微調的語音識別模型,支持16kHz採樣率的語音輸入。
下載量 29.57k
發布時間 : 3/2/2022

模型概述

這是一個針對馬拉雅拉姆語優化的自動語音識別模型,基於XLSR-53架構微調,適用於馬拉雅拉姆語語音轉文本任務。

模型特點

多數據集訓練
使用了四個不同的馬拉雅拉姆語語音數據集進行訓練,提高了模型的泛化能力。
低詞錯誤率
在組合測試集上達到28.43%的詞錯誤率,表現良好。
即用型模型
無需額外語言模型即可直接使用,簡化了部署流程。

模型能力

馬拉雅拉姆語語音識別
16kHz語音處理
自動語音轉文本

使用案例

語音轉寫
馬拉雅拉姆語語音轉錄
將馬拉雅拉姆語語音內容轉換為文本
28.43%詞錯誤率
語音助手
本地化語音交互
為馬拉雅拉姆語用戶提供語音交互支持
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase