W

Wav2vec2 Large Xlsr 53 Portuguese

由facebook開發
Facebook開發的基於Wav2Vec 2.0架構的大規模葡萄牙語自動語音識別(ASR)模型,支持葡萄牙語語音轉文本任務。
下載量 425
發布時間 : 3/2/2022

模型概述

該模型是基於Wav2Vec 2.0架構訓練的大規模跨語言語音表示模型(XLSR),專門針對葡萄牙語進行了優化,能夠將葡萄牙語語音準確轉換為文本。

模型特點

跨語言語音表示
基於XLSR-53架構,能夠學習跨語言的通用語音特徵表示
葡萄牙語優化
專門針對葡萄牙語語音特點進行了優化訓練
端到端識別
直接從原始音頻輸入生成文本輸出,無需中間特徵提取步驟

模型能力

葡萄牙語語音識別
語音轉文本
自動語音轉錄

使用案例

語音轉錄
葡萄牙語語音轉文字
將葡萄牙語語音內容自動轉換為可編輯的文本格式
在Common Voice葡萄牙語測試集上WER為27.1%
語音助手
葡萄牙語語音指令識別
用於構建葡萄牙語語音助手和語音控制應用
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase