W

Wav2vec2 Large Xls R 300m Hsb V2

由DrishtiSharma開發
這是一個基於Facebook的wav2vec2-xls-r-300m模型在上索布語(HSB)數據集上微調的自動語音識別(ASR)模型。
下載量 19
發布時間 : 3/2/2022

模型概述

該模型專門用於上索布語的語音識別任務,在Common Voice 8數據集上進行了微調,能夠將上索布語語音轉換為文本。

模型特點

上索布語專用
專門為上索布語優化的語音識別模型
基於大規模預訓練模型
基於Facebook的wav2vec2-xls-r-300m模型微調,具備強大的語音特徵提取能力
相對較高的識別準確率
在Common Voice 8測試集上達到46.5%的詞錯誤率(WER)和11.4%的字錯誤率(CER)

模型能力

上索布語語音識別
語音轉文本
自動語音轉錄

使用案例

語音轉錄
上索布語語音轉錄
將上索布語語音內容轉換為文本
在Common Voice 8測試集上WER為46.5%
語言保護
少數民族語言數字化
幫助保存和數字化上索布語等少數民族語言
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase