W

Wav2vec2 Xls R 300m Cs Cv8

由comodoro開發
基於facebook/wav2vec2-xls-r-300m在Common Voice 8.0捷克語數據集上微調的語音識別模型
下載量 13
發布時間 : 3/2/2022

模型概述

該模型是針對捷克語優化的自動語音識別(ASR)模型,基於Wav2Vec2架構,在Common Voice 8.0數據集上微調,支持16kHz採樣率的語音輸入。

模型特點

高性能捷克語識別
在Common Voice 8.0測試集上達到10.3%的WER和2.6%的CER
基於XLSR架構
使用facebook的wav2vec2-xls-r-300m作為基礎模型,具有強大的跨語言表示能力
無需語言模型
可直接使用,無需額外語言模型支持

模型能力

捷克語語音識別
16kHz音頻處理
端到端語音轉文本

使用案例

語音轉寫
語音筆記轉文字
將捷克語語音筆記轉換為可編輯文本
高準確率的文本輸出
語音助手
用於捷克語語音助手應用的語音識別組件
低延遲的語音理解
語音分析
語音內容分析
分析捷克語語音內容並提取關鍵信息
支持後續自然語言處理任務
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase