W

Wav2vec2 Xls R 1b Polish

由jonatasgrosman開發
這是一個基於XLS-R 10億參數模型微調的波蘭語自動語音識別(ASR)模型,在Common Voice 8.0等數據集上訓練,支持16kHz採樣率的語音輸入。
下載量 212
發布時間 : 3/2/2022

模型概述

該模型是針對波蘭語優化的自動語音識別系統,基於Facebook的XLS-R 10億參數模型微調而成,在波蘭語語音識別任務上表現出色。

模型特點

高性能波蘭語識別
在Common Voice 8.0測試集上達到11.01%的WER和2.55%的CER
支持語言模型增強
結合語言模型後,WER可降至7.32%,CER降至1.95%
大規模預訓練基礎
基於XLS-R 10億參數模型微調,具備強大的語音特徵提取能力
多數據集訓練
使用Common Voice 8.0、Multilingual LibriSpeech和Voxpopuli數據集訓練

模型能力

波蘭語語音識別
16kHz音頻處理
批量語音轉錄

使用案例

語音轉錄
語音轉文字服務
將波蘭語語音內容轉換為文字
在標準測試集上達到92.68%的準確率(使用語言模型)
語音助手
波蘭語語音指令識別
用於語音控制設備和應用程序
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase