W

Wav2vec2 Large Xlsr Ia

由gchhablani開發
這是一個基於Facebook的wav2vec2-large-xlsr-53模型在國際語(Interlingua)上微調的自動語音識別(ASR)模型,使用通用語音(Common Voice)數據集訓練。
下載量 367
發布時間 : 3/2/2022

模型概述

該模型用於國際語的自動語音識別任務,能夠將語音輸入轉換為文本輸出。

模型特點

多語言支持
基於XLSR-53模型,具有跨語言學習能力
高精度識別
在國際語測試集上達到25.09%的詞錯誤率(WER)
易於使用
提供簡單的API接口,可直接用於語音識別

模型能力

語音識別
國際語語音轉文本
16kHz音頻處理

使用案例

語音轉錄
國際語語音轉錄
將國際語語音內容轉換為文本
詞錯誤率25.09%
語音助手
國際語語音指令識別
用於構建支持國際語的語音助手
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase