W

Wav2vec2 Large Xlsr Kyrgyz

由iarfmoose開發
這是一個基於facebook/wav2vec2-large-xlsr-53模型在吉爾吉斯語通用語音數據集上微調的自動語音識別模型。
下載量 22
發布時間 : 3/2/2022

模型概述

該模型專門用於吉爾吉斯語的自動語音識別任務,支持16kHz採樣率的語音輸入。

模型特點

多語言預訓練基礎
基於facebook/wav2vec2-large-xlsr-53模型微調,該模型已在多種語言上進行預訓練
特定語言優化
專門針對吉爾吉斯語進行優化,提高了該語言的識別準確率
輕量級部署
可直接使用,無需額外語言模型支持

模型能力

吉爾吉斯語語音識別
16kHz音頻處理

使用案例

語音轉文字
吉爾吉斯語語音轉錄
將吉爾吉斯語語音轉換為文字
測試WER為34.71%
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase