W

Wav2vec2 Large Xls R 300m Sat Final

由DrishtiSharma開發
這是一個基於facebook/wav2vec2-xls-r-300m在MOZILLA-FOUNDATION/COMMON_VOICE_8_0 - SAT數據集上微調的自動語音識別模型,支持Santali (Ol Chiki)語言。
下載量 28
發布時間 : 3/2/2022

模型概述

該模型是一個自動語音識別(ASR)模型,專門用於Santali (Ol Chiki)語言的語音轉文字任務。

模型特點

多語言支持
專門針對Santali (Ol Chiki)語言進行了優化
高性能
在Common Voice 8測試集上取得了34.94%的詞錯誤率(WER)和13.77%的字錯誤率(CER)
基於大規模預訓練
基於facebook/wav2vec2-xls-r-300m模型微調,繼承了強大的語音特徵提取能力

模型能力

語音識別
Santali (Ol Chiki)語言處理
語音轉文字

使用案例

語音轉錄
Santali語音轉錄
將Santali語言的語音內容轉換為文字
在測試集上達到34.94%的詞錯誤率
語音助手
Santali語音助手
為Santali語言使用者提供語音交互能力
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase