W

Wav2vec2 Large Xls R 300m Sat A3

由DrishtiSharma開發
基於Facebook的wav2vec2-xls-r-300m模型在桑塔利語(Ol Chiki)語音數據集上微調的自動語音識別(ASR)模型
下載量 29
發布時間 : 3/2/2022

模型概述

該模型是針對桑塔利語優化的自動語音識別系統,在Common Voice 8數據集上訓練,支持將桑塔利語語音轉換為文本

模型特點

桑塔利語優化
專門針對桑塔利語(Ol Chiki)進行微調,提供更好的語音識別準確率
基於XLS-R架構
使用Facebook強大的wav2vec2-XLS-R-300m作為基礎模型
多場景適用
在Common Voice數據集上表現良好,適用於多種語音識別場景

模型能力

桑塔利語語音識別
語音轉文本
自動語音識別

使用案例

語音轉錄
桑塔利語語音轉錄
將桑塔利語語音內容轉換為文本
在Common Voice 8測試集上WER為0.357,CER為0.142
語音助手
桑塔利語語音指令識別
用於桑塔利語語音助手或交互系統
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase