W

Wav2vec2 Large Xls R 300m Sr V4

由DrishtiSharma開發
基於facebook/wav2vec2-xls-r-300m在塞爾維亞語(sr)數據集上微調的自動語音識別模型
下載量 28
發布時間 : 3/2/2022

模型概述

該模型是針對塞爾維亞語的自動語音識別(ASR)任務優化的wav2vec2模型,在Common Voice 8數據集上微調,支持塞爾維亞語語音轉文本任務。

模型特點

塞爾維亞語優化
專門針對塞爾維亞語進行微調,在Common Voice 8數據集上表現良好
基於大模型
基於facebook的wav2vec2-xls-r-300m大模型架構,具備強大的語音特徵提取能力
多場景評估
在Common Voice和魯棒語音賽事等多個數據集上進行評估

模型能力

塞爾維亞語語音識別
語音轉文本
長音頻處理(支持分塊處理)

使用案例

語音轉錄
塞爾維亞語語音轉錄
將塞爾維亞語語音轉換為文本
在Common Voice 8測試集上WER為30.33%
語音識別系統
語音助手
用於塞爾維亞語語音助手開發
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase