W

Wav2vec2 Xls R 300m Cs 250

由comodoro開發
這是一個基於facebook/wav2vec2-xls-r-300m在捷克語數據集上微調的自動語音識別模型,支持16kHz採樣率的語音輸入。
下載量 248.66k
發布時間 : 3/2/2022

模型概述

該模型是針對捷克語的自動語音識別模型,在Common Voice 8.0等數據集上微調,可直接使用或配合語言模型使用。

模型特點

多數據集訓練
使用了Common Voice 8.0、OVM、PSCR和Vystadial2016等多個捷克語數據集進行訓練
高性能
在Common Voice 8.0測試集上達到7.3%的詞錯誤率和2.1%的字符錯誤率
直接使用
無需語言模型即可直接進行語音識別

模型能力

捷克語語音識別
16kHz採樣率語音處理
無語言模型直接推理

使用案例

語音轉錄
語音轉文字
將捷克語語音內容轉換為文字
詞錯誤率7.3%,字符錯誤率2.1%
語音分析
語音內容分析
分析捷克語語音內容
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase