W

Wav2vec2 Xlsr Chuvash

由gagan3012開發
基於facebook/wav2vec2-large-xlsr-53在楚瓦什語上的微調模型,用於自動語音識別任務。
下載量 54
發布時間 : 3/2/2022

模型概述

該模型是基於Facebook的wav2vec2-large-xlsr-53模型在楚瓦什語上進行微調的自動語音識別(ASR)模型,使用Common Voice數據集訓練,支持楚瓦什語的語音轉文本功能。

模型特點

楚瓦什語支持
專門針對楚瓦什語優化的語音識別模型
基於XLSR-53架構
利用大規模跨語言語音表示學習預訓練模型
無需語言模型
可直接使用,不需要額外的語言模型支持

模型能力

楚瓦什語語音識別
音頻轉文本
16kHz音頻處理

使用案例

語音轉寫
楚瓦什語語音轉錄
將楚瓦什語語音內容轉換為文本
在Common Voice測試集上WER為48.40%
語音輔助應用
楚瓦什語語音助手
用於開發楚瓦什語語音控制應用
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase