W

Wav2vec2 Large Xlsr Or

由danurahul開發
基於Facebook的wav2vec2-large-xlsr-53模型在Odia語言上微調的自動語音識別模型
下載量 22
發布時間 : 3/2/2022

模型概述

該模型是專門為Odia語言優化的自動語音識別(ASR)系統,基於Common Voice數據集微調,適用於16kHz採樣率的語音輸入。

模型特點

多語言預訓練基礎
基於Facebook的多語言wav2vec2-large-xlsr-53模型微調,具有強大的語音特徵提取能力
低資源語言優化
專門針對Odia這種資源相對較少的語言進行優化
端到端語音識別
無需語言模型即可直接進行語音到文本轉換

模型能力

語音識別
音頻轉文本
Odia語音處理

使用案例

語音轉錄
Odia語音轉錄
將Odia語音內容轉換為文本
在Common Voice測試集上達到54.6% WER
語音助手
Odia語音助手
支持Odia語言的語音交互系統
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase