W

Wav2vec2 Large Xlsr Cnh

由gchhablani開發
基於facebook/wav2vec2-large-xlsr-53模型微調的哈卡欽語語音識別模型,在通用語音數據集上訓練,測試WER為31.38%。
下載量 22
發布時間 : 3/2/2022

模型概述

這是一個用於哈卡欽語自動語音識別(ASR)的模型,基於Wav2Vec2 Large XLSR-53架構微調而成,能夠將哈卡欽語語音轉換為文本。

模型特點

基於XLSR-53架構
使用facebook的wav2vec2-large-xlsr-53作為基礎模型,該架構在大規模跨語言語音表示學習方面表現優異。
低資源語言支持
專門針對哈卡欽語這種資源較少的語言進行優化,有助於保護語言多樣性。
無需語言模型
可以直接使用而無需額外的語言模型,簡化了部署流程。

模型能力

語音識別
哈卡欽語語音轉文本
16kHz音頻處理

使用案例

語音技術
哈卡欽語語音轉錄
將哈卡欽語語音內容自動轉換為文字
詞錯誤率(WER)31.38%
語音助手開發
為哈卡欽語用戶開發語音交互應用
語言保護
少數民族語言數字化
幫助保存和數字化哈卡欽語等少數民族語言
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase