W

Wav2vec2 Large Xlsr 53 Ukrainian

由mrm8488開發
基於facebook/wav2vec2-large-xlsr-53在烏克蘭語上使用Common Voice數據集進行微調的自動語音識別模型
下載量 25
發布時間 : 3/2/2022

模型概述

該模型是一個用於烏克蘭語自動語音識別(ASR)的Wav2Vec2模型,基於XLSR-53架構微調,支持16kHz採樣率的語音輸入。

模型特點

烏克蘭語優化
專門針對烏克蘭語進行微調,優化了語音識別性能
基於XLSR-53架構
使用強大的wav2vec2-large-xlsr-53作為基礎模型
無需語言模型
可直接使用,無需額外的語言模型支持

模型能力

烏克蘭語語音識別
16kHz音頻處理
端到端語音轉文本

使用案例

語音轉寫
烏克蘭語語音轉錄
將烏克蘭語語音內容轉換為文本
測試WER為41.82%
語音助手
烏克蘭語語音命令識別
用於理解烏克蘭語語音命令
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase