W

Wav2vec2 Xls R 300m Italian Robust

由dbdmg開發
基於facebook/wav2vec2-xls-r-300m在多個意大利語語音數據集上微調的自動語音識別模型
下載量 28
發布時間 : 3/2/2022

模型概述

這是一個針對意大利語的自動語音識別(ASR)模型,基於XLS-R架構,在Common Voice等公開數據集上微調而成,支持帶語言模型的增強識別。

模型特點

多數據集訓練
在Common Voice、LibriSpeech、TED等多語言數據集上微調,提高模型魯棒性
語言模型增強
支持結合語言模型進行識別,WER相對降低約30%
跨場景適應
在魯棒語音事件數據集上表現良好,適應不同錄音環境

模型能力

意大利語語音轉文本
帶語言模型的增強識別
多種口音識別

使用案例

語音轉錄
會議記錄
將意大利語會議錄音轉換為文字記錄
CER 3.52%(帶語言模型)
媒體字幕生成
為意大利語視頻內容自動生成字幕
語音交互
語音助手
支持意大利語語音指令識別
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase