W

Wav2vec2 Large Xlsr Upper Sorbian Mixed

由jimregan開發
這是一個基於facebook/wav2vec2-large-xlsr-53微調的上索布語語音識別模型,訓練數據來自通用語音數據集和在線索布語課程。
下載量 25
發布時間 : 3/2/2022

模型概述

該模型用於上索布語的自動語音識別任務,支持16kHz採樣率的語音輸入。

模型特點

多源數據訓練
結合了通用語音數據集和在線索布語課程數據,增強了模型性能
高兼容性
支持16kHz採樣率的語音輸入,適用於多種語音識別場景
預訓練微調
基於facebook/wav2vec2-large-xlsr-53模型微調,繼承了強大的語音特徵提取能力

模型能力

上索布語語音識別
自動語音轉文本

使用案例

教育
索布語學習輔助
幫助學習者通過語音識別檢查發音準確性
語音轉寫
上索布語語音轉錄
將上索布語語音內容轉換為文本
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase