W

Wav2vec2 Large Xlsr 53 Italian

由jonatasgrosman開發
基於facebook/wav2vec2-large-xlsr-53模型微調的意大利語自動語音識別模型,在Common Voice 6.1數據集上訓練
下載量 1,012
發布時間 : 3/2/2022

模型概述

該模型是針對意大利語優化的自動語音識別(ASR)模型,基於XLSR-53架構微調,支持16kHz採樣率的語音輸入轉換

模型特點

高性能意大利語識別
在Common Voice意大利語測試集上達到9.41%的詞錯誤率(WER)和2.29%的字符錯誤率(CER)
語言模型增強
結合語言模型後,詞錯誤率可進一步降低至6.91%,字符錯誤率降至1.83%
多場景適用
在標準測試集和魯棒語音賽事開發集上均表現良好,顯示較強的泛化能力
易用集成
提供HuggingSound庫和自定義腳本兩種使用方式,便於快速集成到應用中

模型能力

意大利語語音轉文本
16kHz音頻處理
批量語音識別
長音頻分塊處理

使用案例

語音轉錄
意大利語語音內容轉錄
將意大利語語音內容轉換為文本格式
高準確率的轉錄結果,適合內容存檔和分析
語音助手
意大利語語音指令識別
用於意大利語語音助手系統中的指令識別
低延遲高準確率的指令識別
無障礙應用
語音轉文字輔助
為聽力障礙人士提供即時語音轉文字服務
高準確率的即時轉換
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase