W

Wav2vec2 Large Xlsr 53 Italian

由facebook開發
Facebook 發佈的基於 Wav2Vec2 架構的大規模意大利語自動語音識別模型,在 Common Voice 數據集上微調
下載量 4,013
發布時間 : 3/2/2022

模型概述

該模型是基於 Wav2Vec2 架構的自動語音識別(ASR)系統,專門針對意大利語優化,能夠將意大利語音頻轉換為文本

模型特點

大規模預訓練
基於 XLSR-53 大規模多語言語音表示學習模型
意大利語優化
專門針對意大利語進行微調,提高識別準確率
高效語音處理
支持 16kHz 採樣率音頻輸入,適合常見語音應用場景

模型能力

意大利語音頻轉文本
語音識別
語音轉錄

使用案例

語音轉寫
意大利語會議記錄
將意大利語會議錄音自動轉換為文字記錄
在 Common Voice 測試集上 WER 22.1%
語音助手
為意大利語語音助手提供語音識別能力
無障礙應用
即時字幕生成
為意大利語視頻內容生成即時字幕
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase