W

Wav2vec2 Large Xlsr 53 Italian

Developed by jonatasgrosman
基於facebook/wav2vec2-large-xlsr-53模型微調的意大利語自動語音識別模型,在Common Voice 6.1數據集上訓練
Downloads 1,012
Release Time : 3/2/2022

Model Overview

該模型是針對意大利語優化的自動語音識別(ASR)模型,基於XLSR-53架構微調,支持16kHz採樣率的語音輸入轉換

Model Features

高性能意大利語識別
在Common Voice意大利語測試集上達到9.41%的詞錯誤率(WER)和2.29%的字符錯誤率(CER)
語言模型增強
結合語言模型後,詞錯誤率可進一步降低至6.91%,字符錯誤率降至1.83%
多場景適用
在標準測試集和魯棒語音賽事開發集上均表現良好,顯示較強的泛化能力
易用集成
提供HuggingSound庫和自定義腳本兩種使用方式,便於快速集成到應用中

Model Capabilities

意大利語語音轉文本
16kHz音頻處理
批量語音識別
長音頻分塊處理

Use Cases

語音轉錄
意大利語語音內容轉錄
將意大利語語音內容轉換為文本格式
高準確率的轉錄結果,適合內容存檔和分析
語音助手
意大利語語音指令識別
用於意大利語語音助手系統中的指令識別
低延遲高準確率的指令識別
無障礙應用
語音轉文字輔助
為聽力障礙人士提供即時語音轉文字服務
高準確率的即時轉換
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase