W

Wav2vec2 Large Xlsr 53 Polish

由facebook開發
Facebook開發的波蘭語自動語音識別模型,基於Wav2Vec2架構和XLSR-53多語言預訓練模型
下載量 174
發布時間 : 3/2/2022

模型概述

這是一個針對波蘭語優化的自動語音識別模型,基於大規模自監督學習預訓練,適用於語音轉文本任務

模型特點

多語言預訓練基礎
基於XLSR-53多語言模型微調,具有強大的跨語言表示能力
高精度波蘭語識別
專門針對波蘭語優化,在Common Voice測試集上達到24.6%詞錯率
端到端語音識別
直接從原始音頻輸入生成文本輸出,無需傳統ASR系統的複雜組件

模型能力

波蘭語語音識別
音頻轉文本
語音內容轉錄

使用案例

語音轉錄
語音備忘錄轉錄
將波蘭語語音備忘錄自動轉換為可搜索的文本
24.6%詞錯率(在Common Voice測試集上)
客服電話記錄
自動轉錄波蘭語客服通話內容用於後續分析
輔助技術
語音控制應用
為波蘭語用戶提供語音控制界面
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase